Scala - Expresiones regulares
Este capítulo explica cómo Scala admite expresiones regulares a través de Regex class disponible en el paquete scala.util.matching.
Pruebe el siguiente programa de ejemplo donde intentaremos encontrar la palabra Scala de una declaración.
Ejemplo
import scala.util.matching.Regex
object Demo {
def main(args: Array[String]) {
val pattern = "Scala".r
val str = "Scala is Scalable and cool"
println(pattern findFirstIn str)
}
}
Guarde el programa anterior en Demo.scala. Los siguientes comandos se utilizan para compilar y ejecutar este programa.
Mando
\>scalac Demo.scala
\>scala Demo
Salida
Some(Scala)
Creamos un String y llamamos al r( )método en él. Scala convierte implícitamente el String en RichString e invoca ese método para obtener una instancia de Regex. Para encontrar una primera coincidencia de la expresión regular, simplemente llame alfindFirstIn()método. Si en lugar de encontrar solo la primera aparición nos gustaría encontrar todas las apariciones de la palabra coincidente, podemos usar lafindAllIn( ) y en caso de que haya varias palabras Scala disponibles en la cadena de destino, esto devolverá una colección de todas las palabras coincidentes.
Puede hacer uso del método mkString () para concatenar la lista resultante y puede usar una tubería (|) para buscar mayúsculas y minúsculas de Scala y puede usar Regex constructor en su lugar o r() método para crear un patrón.
Pruebe el siguiente programa de ejemplo.
Ejemplo
import scala.util.matching.Regex
object Demo {
def main(args: Array[String]) {
val pattern = new Regex("(S|s)cala")
val str = "Scala is scalable and cool"
println((pattern findAllIn str).mkString(","))
}
}
Guarde el programa anterior en Demo.scala. Los siguientes comandos se utilizan para compilar y ejecutar este programa.
Mando
\>scalac Demo.scala
\>scala Demo
Salida
Scala,scala
Si desea reemplazar el texto coincidente, podemos usar replaceFirstIn( ) para reemplazar la primera coincidencia o replaceAllIn( ) para reemplazar todas las ocurrencias.
Ejemplo
object Demo {
def main(args: Array[String]) {
val pattern = "(S|s)cala".r
val str = "Scala is scalable and cool"
println(pattern replaceFirstIn(str, "Java"))
}
}
Guarde el programa anterior en Demo.scala. Los siguientes comandos se utilizan para compilar y ejecutar este programa.
Mando
\>scalac Demo.scala
\>scala Demo
Salida
Java is scalable and cool
Formando expresiones regulares
Scala hereda su sintaxis de expresión regular de Java, que a su vez hereda la mayoría de las características de Perl. Estos son solo algunos ejemplos que deberían ser suficientes como recordatorios:
A continuación se muestra la tabla que enumera toda la sintaxis de caracteres meta de expresión regular disponible en Java.
Subexpresión | Partidos |
---|---|
^ | Coincide con el comienzo de la línea. |
PS | Coincide con el final de la línea. |
. | Coincide con cualquier carácter individual excepto nueva línea. El uso de la opción m también le permite hacer coincidir la nueva línea. |
[...] | Coincide con cualquier carácter individual entre paréntesis. |
[^ ...] | Coincide con cualquier carácter individual que no esté entre corchetes |
\\UN | Comienzo de toda la cadena |
\\ z | Fin de toda la cadena |
\\ Z | Fin de toda la cadena excepto el terminador de línea final permitido. |
re* | Coincide con 0 o más apariciones de la expresión anterior. |
re + | Coincide con 1 o más de lo anterior |
¿re? | Coincide con 0 o 1 aparición de la expresión anterior. |
re {n} | Coincide exactamente con n número de apariciones de la expresión anterior. |
re {n,} | Coincide con no más ocurrencias de la expresión anterior. |
re {n, m} | Coincide con al menos n y como máximo m apariciones de la expresión anterior. |
a | b | Coincide con a o b. |
(re) | Agrupa expresiones regulares y recuerda texto coincidente. |
(?: re) | Agrupa expresiones regulares sin recordar el texto coincidente. |
(?> re) | Coincide con el patrón independiente sin retroceso. |
\\ w | Coincide con caracteres de palabras. |
\\ W | Coincide con caracteres que no son palabras. |
\\ s | Coincide con los espacios en blanco. Equivalente a [\ t \ n \ r \ f]. |
\\ S | Coincide con espacios que no son en blanco. |
\\re | Coincide con dígitos. Equivalente a [0-9]. |
\\RE | Coincide con no dígitos. |
\\UN | Coincide con el comienzo de la cadena. |
\\ Z | Coincide con el final de la cuerda. Si existe una nueva línea, coincide justo antes de la nueva línea. |
\\ z | Coincide con el final de la cuerda. |
\\GRAMO | Los partidos apuntan donde terminó el último partido. |
\\norte | Referencia inversa para capturar el número de grupo "n" |
\\segundo | Coincide con los límites de las palabras cuando están fuera de los corchetes. Coincide con el retroceso (0x08) cuando está entre corchetes. |
\\SEGUNDO | Coincide con los límites que no son de palabras. |
\\ n, \\ t, etc. | Coincide con nuevas líneas, retornos de carro, pestañas, etc. |
\\ Q | Escape (comillas) todos los caracteres hasta \\ E |
\\MI | Termina la cita comenzada con \\ Q |
Ejemplos de expresiones regulares
Ejemplo | Descripción |
---|---|
. | Coincidir con cualquier carácter excepto nueva línea |
[Rr] uby | Coincidir con "Ruby" o "ruby" |
frotar [ye] | Coincidir con "ruby" o "rube" |
[aeiou] | Coincide con cualquier vocal minúscula |
[0-9] | Coincidir con cualquier dígito; igual que [0123456789] |
[Arizona] | Coincide con cualquier letra ASCII minúscula |
[ARIZONA] | Coincide con cualquier letra ASCII mayúscula |
[a-zA-Z0-9] | Coincide con cualquiera de los anteriores |
[^ aeiou] | Coincidir con cualquier otra cosa que no sea una vocal minúscula |
[^ 0-9] | Coincidir con cualquier cosa que no sea un dígito |
\\re | Coincide con un dígito: [0-9] |
\\RE | Coincidir con un no dígito: [^ 0-9] |
\\ s | Coincide con un carácter de espacio en blanco: [\ t \ r \ n \ f] |
\\ S | Coincidir con espacios que no son en blanco: [^ \ t \ r \ n \ f] |
\\ w | Coincide con un carácter de una sola palabra: [A-Za-z0-9_] |
\\ W | Coincide con un carácter que no es una palabra: [^ A-Za-z0-9_] |
¿rubí? | Coincidir con "rub" o "ruby": la y es opcional |
rubí* | Coincide con "frotar" más 0 o más ys |
rubí + | Coincide con "frotar" más 1 o más ys |
\\ d {3} | Coincidir exactamente con 3 dígitos |
\\ d {3,} | Coincide con 3 o más dígitos |
\\ d {3,5} | Coincide con 3, 4 o 5 dígitos |
\\ D \\ d + | Ningún grupo: + repite \\ d |
(\\ D \\ d) + / | Agrupados: + repeticiones \\ D \ d par |
([Rr] uby (,)?) + | Coincide con "Ruby", "Ruby, ruby, ruby", etc. |
Note- que cada barra invertida aparece dos veces en la cadena de arriba. Esto se debe a que en Java y Scala una sola barra invertida es un carácter de escape en una cadena literal, no un carácter regular que aparece en la cadena. Entonces, en lugar de '\', debe escribir '\\' para obtener una sola barra invertida en la cadena.
Pruebe el siguiente programa de ejemplo.
Ejemplo
import scala.util.matching.Regex
object Demo {
def main(args: Array[String]) {
val pattern = new Regex("abl[ae]\\d+")
val str = "ablaw is able1 and cool"
println((pattern findAllIn str).mkString(","))
}
}
Guarde el programa anterior en Demo.scala. Los siguientes comandos se utilizan para compilar y ejecutar este programa.
Mando
\>scalac Demo.scala
\>scala Demo
Salida
able1