Scala - Expresiones regulares

Este capítulo explica cómo Scala admite expresiones regulares a través de Regex class disponible en el paquete scala.util.matching.

Pruebe el siguiente programa de ejemplo donde intentaremos encontrar la palabra Scala de una declaración.

Ejemplo

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = "Scala".r
      val str = "Scala is Scalable and cool"
      
      println(pattern findFirstIn str)
   }
}

Guarde el programa anterior en Demo.scala. Los siguientes comandos se utilizan para compilar y ejecutar este programa.

Mando

\>scalac Demo.scala
\>scala Demo

Salida

Some(Scala)

Creamos un String y llamamos al r( )método en él. Scala convierte implícitamente el String en RichString e invoca ese método para obtener una instancia de Regex. Para encontrar una primera coincidencia de la expresión regular, simplemente llame alfindFirstIn()método. Si en lugar de encontrar solo la primera aparición nos gustaría encontrar todas las apariciones de la palabra coincidente, podemos usar lafindAllIn( ) y en caso de que haya varias palabras Scala disponibles en la cadena de destino, esto devolverá una colección de todas las palabras coincidentes.

Puede hacer uso del método mkString () para concatenar la lista resultante y puede usar una tubería (|) para buscar mayúsculas y minúsculas de Scala y puede usar Regex constructor en su lugar o r() método para crear un patrón.

Pruebe el siguiente programa de ejemplo.

Ejemplo

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = new Regex("(S|s)cala")
      val str = "Scala is scalable and cool"
      
      println((pattern findAllIn str).mkString(","))
   }
}

Guarde el programa anterior en Demo.scala. Los siguientes comandos se utilizan para compilar y ejecutar este programa.

Mando

\>scalac Demo.scala
\>scala Demo

Salida

Scala,scala

Si desea reemplazar el texto coincidente, podemos usar replaceFirstIn( ) para reemplazar la primera coincidencia o replaceAllIn( ) para reemplazar todas las ocurrencias.

Ejemplo

object Demo {
   def main(args: Array[String]) {
      val pattern = "(S|s)cala".r
      val str = "Scala is scalable and cool"
      
      println(pattern replaceFirstIn(str, "Java"))
   }
}

Guarde el programa anterior en Demo.scala. Los siguientes comandos se utilizan para compilar y ejecutar este programa.

Mando

\>scalac Demo.scala
\>scala Demo

Salida

Java is scalable and cool

Formando expresiones regulares

Scala hereda su sintaxis de expresión regular de Java, que a su vez hereda la mayoría de las características de Perl. Estos son solo algunos ejemplos que deberían ser suficientes como recordatorios:

A continuación se muestra la tabla que enumera toda la sintaxis de caracteres meta de expresión regular disponible en Java.

Subexpresión Partidos
^ Coincide con el comienzo de la línea.
PS Coincide con el final de la línea.
. Coincide con cualquier carácter individual excepto nueva línea. El uso de la opción m también le permite hacer coincidir la nueva línea.
[...] Coincide con cualquier carácter individual entre paréntesis.
[^ ...] Coincide con cualquier carácter individual que no esté entre corchetes
\\UN Comienzo de toda la cadena
\\ z Fin de toda la cadena
\\ Z Fin de toda la cadena excepto el terminador de línea final permitido.
re* Coincide con 0 o más apariciones de la expresión anterior.
re + Coincide con 1 o más de lo anterior
¿re? Coincide con 0 o 1 aparición de la expresión anterior.
re {n} Coincide exactamente con n número de apariciones de la expresión anterior.
re {n,} Coincide con no más ocurrencias de la expresión anterior.
re {n, m} Coincide con al menos n y como máximo m apariciones de la expresión anterior.
a | b Coincide con a o b.
(re) Agrupa expresiones regulares y recuerda texto coincidente.
(?: re) Agrupa expresiones regulares sin recordar el texto coincidente.
(?> re) Coincide con el patrón independiente sin retroceso.
\\ w Coincide con caracteres de palabras.
\\ W Coincide con caracteres que no son palabras.
\\ s Coincide con los espacios en blanco. Equivalente a [\ t \ n \ r \ f].
\\ S Coincide con espacios que no son en blanco.
\\re Coincide con dígitos. Equivalente a [0-9].
\\RE Coincide con no dígitos.
\\UN Coincide con el comienzo de la cadena.
\\ Z Coincide con el final de la cuerda. Si existe una nueva línea, coincide justo antes de la nueva línea.
\\ z Coincide con el final de la cuerda.
\\GRAMO Los partidos apuntan donde terminó el último partido.
\\norte Referencia inversa para capturar el número de grupo "n"
\\segundo Coincide con los límites de las palabras cuando están fuera de los corchetes. Coincide con el retroceso (0x08) cuando está entre corchetes.
\\SEGUNDO Coincide con los límites que no son de palabras.
\\ n, \\ t, etc. Coincide con nuevas líneas, retornos de carro, pestañas, etc.
\\ Q Escape (comillas) todos los caracteres hasta \\ E
\\MI Termina la cita comenzada con \\ Q

Ejemplos de expresiones regulares

Ejemplo Descripción
. Coincidir con cualquier carácter excepto nueva línea
[Rr] uby Coincidir con "Ruby" o "ruby"
frotar [ye] Coincidir con "ruby" o "rube"
[aeiou] Coincide con cualquier vocal minúscula
[0-9] Coincidir con cualquier dígito; igual que [0123456789]
[Arizona] Coincide con cualquier letra ASCII minúscula
[ARIZONA] Coincide con cualquier letra ASCII mayúscula
[a-zA-Z0-9] Coincide con cualquiera de los anteriores
[^ aeiou] Coincidir con cualquier otra cosa que no sea una vocal minúscula
[^ 0-9] Coincidir con cualquier cosa que no sea un dígito
\\re Coincide con un dígito: [0-9]
\\RE Coincidir con un no dígito: [^ 0-9]
\\ s Coincide con un carácter de espacio en blanco: [\ t \ r \ n \ f]
\\ S Coincidir con espacios que no son en blanco: [^ \ t \ r \ n \ f]
\\ w Coincide con un carácter de una sola palabra: [A-Za-z0-9_]
\\ W Coincide con un carácter que no es una palabra: [^ A-Za-z0-9_]
¿rubí? Coincidir con "rub" o "ruby": la y es opcional
rubí* Coincide con "frotar" más 0 o más ys
rubí + Coincide con "frotar" más 1 o más ys
\\ d {3} Coincidir exactamente con 3 dígitos
\\ d {3,} Coincide con 3 o más dígitos
\\ d {3,5} Coincide con 3, 4 o 5 dígitos
\\ D \\ d + Ningún grupo: + repite \\ d
(\\ D \\ d) + / Agrupados: + repeticiones \\ D \ d par
([Rr] uby (,)?) + Coincide con "Ruby", "Ruby, ruby, ruby", etc.

Note- que cada barra invertida aparece dos veces en la cadena de arriba. Esto se debe a que en Java y Scala una sola barra invertida es un carácter de escape en una cadena literal, no un carácter regular que aparece en la cadena. Entonces, en lugar de '\', debe escribir '\\' para obtener una sola barra invertida en la cadena.

Pruebe el siguiente programa de ejemplo.

Ejemplo

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = new Regex("abl[ae]\\d+")
      val str = "ablaw is able1 and cool"
      
      println((pattern findAllIn str).mkString(","))
   }
}

Guarde el programa anterior en Demo.scala. Los siguientes comandos se utilizan para compilar y ejecutar este programa.

Mando

\>scalac Demo.scala
\>scala Demo

Salida

able1