Scala - Espressioni regolari

Questo capitolo spiega come Scala supporta le espressioni regolari tramite Regex class disponibile nel pacchetto scala.util.matching.

Prova il seguente programma di esempio in cui proveremo a trovare la parola Scala da una dichiarazione.

Esempio

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = "Scala".r
      val str = "Scala is Scalable and cool"
      
      println(pattern findFirstIn str)
   }
}

Salva il programma sopra in formato Demo.scala. I seguenti comandi vengono utilizzati per compilare ed eseguire questo programma.

Comando

\>scalac Demo.scala
\>scala Demo

Produzione

Some(Scala)

Creiamo una stringa e chiamiamo il file r( )metodo su di esso. Scala converte implicitamente String in RichString e richiama tale metodo per ottenere un'istanza di Regex. Per trovare una prima corrispondenza dell'espressione regolare, chiama semplicemente il filefindFirstIn()metodo. Se invece di trovare solo la prima occorrenza desideriamo trovare tutte le occorrenze della parola corrispondente, possiamo usare ilfindAllIn( ) e nel caso in cui ci siano più parole Scala disponibili nella stringa di destinazione, questo restituirà una raccolta di tutte le parole corrispondenti.

Puoi usare il metodo mkString () per concatenare l'elenco risultante e puoi usare una barra verticale (|) per cercare in Scala minuscole e maiuscole e puoi usare Regex costruttore invece o r() metodo per creare un pattern.

Prova il seguente programma di esempio.

Esempio

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = new Regex("(S|s)cala")
      val str = "Scala is scalable and cool"
      
      println((pattern findAllIn str).mkString(","))
   }
}

Salva il programma sopra in formato Demo.scala. I seguenti comandi vengono utilizzati per compilare ed eseguire questo programma.

Comando

\>scalac Demo.scala
\>scala Demo

Produzione

Scala,scala

Se desideri sostituire il testo corrispondente, possiamo usare replaceFirstIn( ) per sostituire la prima corrispondenza o replaceAllIn( ) per sostituire tutte le occorrenze.

Esempio

object Demo {
   def main(args: Array[String]) {
      val pattern = "(S|s)cala".r
      val str = "Scala is scalable and cool"
      
      println(pattern replaceFirstIn(str, "Java"))
   }
}

Salva il programma sopra in formato Demo.scala. I seguenti comandi vengono utilizzati per compilare ed eseguire questo programma.

Comando

\>scalac Demo.scala
\>scala Demo

Produzione

Java is scalable and cool

Formazione di espressioni regolari

Scala eredita la sintassi delle espressioni regolari da Java, che a sua volta eredita la maggior parte delle caratteristiche di Perl. Ecco solo alcuni esempi che dovrebbero essere sufficienti come rinfrescanti:

Di seguito è riportata la tabella che elenca tutte le espressioni regolari Sintassi dei caratteri Meta disponibili in Java.

Sottoespressione Partite
^ Corrisponde all'inizio della riga.
$ Corrisponde alla fine della riga.
. Corrisponde a qualsiasi carattere singolo tranne la nuova riga. L'uso dell'opzione m consente anche di abbinare la nuova riga.
[...] Corrisponde a qualsiasi singolo carattere tra parentesi.
[^ ...] Corrisponde a qualsiasi carattere singolo non tra parentesi
\\UN Inizio dell'intera stringa
\\ z Fine dell'intera stringa
\\ Z Fine dell'intera stringa eccetto il terminatore di riga finale consentito.
ri* Corrisponde a 0 o più occorrenze dell'espressione precedente.
re + Corrisponde a 1 o più elementi precedenti
ri? Corrisponde a 0 o 1 occorrenza dell'espressione precedente.
re {n} Corrisponde esattamente al numero n di occorrenze dell'espressione precedente.
re {n,} Corrisponde a n o più occorrenze dell'espressione precedente.
re {n, m} Corrisponde ad almeno n e al massimo m occorrenze dell'espressione precedente.
a | b Corrisponde a a o b.
(ri) Raggruppa le espressioni regolari e ricorda il testo corrispondente.
(?: re) Raggruppa le espressioni regolari senza ricordare il testo corrispondente.
(?> re) Corrisponde a pattern indipendenti senza backtracking.
\\ w Corrisponde ai caratteri delle parole.
\\ W Corrisponde a caratteri non di parole.
\\S Corrisponde allo spazio bianco. Equivalente a [\ t \ n \ r \ f].
\\S Corrisponde a spazi non bianchi.
\\ d Corrisponde alle cifre. Equivalente a [0-9].
\\ D Corrisponde a non cifre.
\\UN Corrisponde all'inizio della stringa.
\\ Z Corrisponde alla fine della stringa. Se esiste una nuova riga, corrisponde appena prima della nuova riga.
\\ z Corrisponde alla fine della stringa.
\\ G Punto delle partite in cui è finita l'ultima partita.
\\ n Riferimento a ritroso per acquisire il numero di gruppo "n"
\\ b Corrisponde ai confini delle parole quando sono al di fuori delle parentesi. Corrisponde a backspace (0x08) quando è racchiuso tra parentesi.
\\ B Corrisponde ai confini non di parole.
\\ n, \\ t, ecc. Trova nuove righe, ritorni a capo, tabulazioni, ecc.
\\ Q Esce (virgolette) tutti i caratteri fino a \\ E
\\ E Termina la citazione iniziata con \\ Q

Esempi di espressioni regolari

Esempio Descrizione
. Trova qualsiasi carattere tranne la nuova riga
[Rr] uby Abbina "Ruby" o "Ruby"
strofina [ye] Trova "ruby" o "rube"
[aeiou] Trova la corrispondenza di una vocale minuscola
[0-9] Trova qualsiasi cifra; uguale a [0123456789]
[az] Trova qualsiasi lettera ASCII minuscola
[AZ] Trova qualsiasi lettera ASCII maiuscola
[a-zA-Z0-9] Abbina uno dei precedenti
[^ aeiou] Trova qualsiasi cosa diversa da una vocale minuscola
[^ 0-9] Trova qualsiasi cosa diversa da una cifra
\\ d Trova una cifra: [0-9]
\\ D Trova una non cifra: [^ 0-9]
\\S Trova uno spazio vuoto: [\ t \ r \ n \ f]
\\S Trova spazio non bianco: [^ \ t \ r \ n \ f]
\\ w Trova il carattere di una singola parola: [A-Za-z0-9_]
\\ W Trova un carattere diverso da una parola: [^ A-Za-z0-9_]
rubino? Trova "rub" o "ruby": la y è facoltativa
rubino* Trova "strofina" più 0 o più anni
rubino + Corrisponde a "strofinare" più 1 o più anni
\\ d {3} Trova esattamente 3 cifre
\\ d {3,} Corrisponde a 3 o più cifre
\\ d {3,5} Trova la corrispondenza di 3, 4 o 5 cifre
\\ D \\ d + Nessun gruppo: + ripete \\ d
(\\ D \\ d) + / Raggruppato: + ripete la coppia \\ D \ d
([Rr] uby (,)?) + Abbina "Ruby", "Ruby, ruby, ruby" e così via.

Note- che ogni barra rovesciata appaia due volte nella stringa sopra. Questo perché in Java e Scala una singola barra rovesciata è un carattere di escape in una stringa letterale, non un carattere normale che compare nella stringa. Quindi, invece di "\", devi scrivere "\\" per ottenere una singola barra rovesciata nella stringa.

Prova il seguente programma di esempio.

Esempio

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = new Regex("abl[ae]\\d+")
      val str = "ablaw is able1 and cool"
      
      println((pattern findAllIn str).mkString(","))
   }
}

Salva il programma sopra in formato Demo.scala. I seguenti comandi vengono utilizzati per compilare ed eseguire questo programma.

Comando

\>scalac Demo.scala
\>scala Demo

Produzione

able1