Scala - Expressions régulières

Ce chapitre explique comment Scala prend en charge les expressions régulières via Regex classe disponible dans le package scala.util.matching.

Essayez l'exemple de programme suivant dans lequel nous essaierons de trouver le mot Scala à partir d'une déclaration.

Exemple

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = "Scala".r
      val str = "Scala is Scalable and cool"
      
      println(pattern findFirstIn str)
   }
}

Enregistrez le programme ci-dessus dans Demo.scala. Les commandes suivantes sont utilisées pour compiler et exécuter ce programme.

Commander

\>scalac Demo.scala
\>scala Demo

Production

Some(Scala)

Nous créons une chaîne et appelons le r( )méthode là-dessus. Scala convertit implicitement le String en RichString et appelle cette méthode pour obtenir une instance de Regex. Pour trouver une première correspondance de l'expression régulière, appelez simplement lefindFirstIn()méthode. Si au lieu de ne trouver que la première occurrence, nous souhaitons trouver toutes les occurrences du mot correspondant, nous pouvons utiliser lefindAllIn( ) et si plusieurs mots Scala sont disponibles dans la chaîne cible, cela renverra une collection de tous les mots correspondants.

Vous pouvez utiliser la méthode mkString () pour concaténer la liste résultante et vous pouvez utiliser un tube (|) pour rechercher les petites et majuscules de Scala et vous pouvez utiliser Regex constructeur à la place ou r() méthode pour créer un motif.

Essayez l'exemple de programme suivant.

Exemple

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = new Regex("(S|s)cala")
      val str = "Scala is scalable and cool"
      
      println((pattern findAllIn str).mkString(","))
   }
}

Enregistrez le programme ci-dessus dans Demo.scala. Les commandes suivantes sont utilisées pour compiler et exécuter ce programme.

Commander

\>scalac Demo.scala
\>scala Demo

Production

Scala,scala

Si vous souhaitez remplacer le texte correspondant, nous pouvons utiliser replaceFirstIn( ) pour remplacer la première correspondance ou replaceAllIn( ) pour remplacer toutes les occurrences.

Exemple

object Demo {
   def main(args: Array[String]) {
      val pattern = "(S|s)cala".r
      val str = "Scala is scalable and cool"
      
      println(pattern replaceFirstIn(str, "Java"))
   }
}

Enregistrez le programme ci-dessus dans Demo.scala. Les commandes suivantes sont utilisées pour compiler et exécuter ce programme.

Commander

\>scalac Demo.scala
\>scala Demo

Production

Java is scalable and cool

Former des expressions régulières

Scala hérite de sa syntaxe d'expression régulière de Java, qui à son tour hérite de la plupart des fonctionnalités de Perl. Voici quelques exemples qui devraient suffire à rafraîchir -

Le tableau suivant répertorie toute la syntaxe de caractères Meta d'expression régulière disponible en Java.

Sous-expression Allumettes
^ Correspond au début de la ligne.
$ Correspond à la fin de la ligne.
. Correspond à n'importe quel caractère unique sauf le saut de ligne. L'utilisation de l'option m lui permet également de correspondre à la nouvelle ligne.
[...] Correspond à n'importe quel caractère unique entre crochets.
[^ ...] Correspond à n'importe quel caractère unique non entre crochets
\\UNE Début de la chaîne entière
\\ z Fin de toute la chaîne
\\ Z Fin de la chaîne entière sauf terminateur de ligne final autorisé.
ré* Correspond à 0 occurrences ou plus de l'expression précédente.
re + Correspond à 1 ou plusieurs éléments précédents
ré? Correspond à 0 ou 1 occurrence de l'expression précédente.
re {n} Correspond exactement au nombre n d'occurrences de l'expression précédente.
re {n,} Correspond à n occurrences ou plus de l'expression précédente.
re {n, m} Correspond à au moins n et au plus m occurrences de l'expression précédente.
a | b Correspond à a ou b.
(ré) Regroupe les expressions régulières et mémorise le texte correspondant.
(?: re) Regroupe les expressions régulières sans se souvenir du texte correspondant.
(?> re) Correspond à un motif indépendant sans retour en arrière.
\\ w Correspond aux caractères des mots.
\\ W Correspond aux caractères non-mots.
\\ s Correspond aux espaces. Équivaut à [\ t \ n \ r \ f].
\\ S Correspond à un espace non blanc.
\\ré Correspond aux chiffres. Équivalent à [0-9].
\\RÉ Correspond aux non-chiffres.
\\UNE Correspond au début de la chaîne.
\\ Z Correspond à la fin de la chaîne. Si une nouvelle ligne existe, elle correspond juste avant la nouvelle ligne.
\\ z Correspond à la fin de la chaîne.
\\G Correspond au point où le dernier match s'est terminé.
\\ n Référence arrière pour capturer le numéro de groupe "n"
\\ b Correspond aux limites des mots en dehors des crochets. Correspond à l'espace arrière (0x08) lorsqu'il est entre crochets.
\\ B Correspond aux limites non-mot.
\\ n, \\ t, etc. Correspond aux retours à la ligne, aux retours chariot, aux tabulations, etc.
\\ Q Échapper (guillemet) tous les caractères jusqu'à \\ E
\\ E Fin des citations commencées par \\ Q

Exemples d'expressions régulières

Exemple La description
. Correspond à n'importe quel caractère sauf le saut de ligne
[Rr] uby Correspond à "Ruby" ou "ruby"
frotter [vous] Correspondre à "ruby" ou "rube"
[aeiou] Correspond à n'importe quelle voyelle minuscule
[0-9] Correspond à n'importe quel chiffre; identique à [0123456789]
[az] Correspond à n'importe quelle lettre ASCII minuscule
[AZ] Correspond à n'importe quelle lettre ASCII majuscule
[a-zA-Z0-9] Correspond à l'un des éléments ci-dessus
[^ aeiou] Correspond à tout autre chose qu'une voyelle minuscule
[^ 0-9] Correspond à autre chose qu'un chiffre
\\ré Faire correspondre un chiffre: [0-9]
\\RÉ Faire correspondre un non-chiffre: [^ 0-9]
\\ s Faire correspondre un caractère d'espacement: [\ t \ r \ n \ f]
\\ S Correspondre à un espace non blanc: [^ \ t \ r \ n \ f]
\\ w Faire correspondre un seul mot: [A-Za-z0-9_]
\\ W Correspond à un caractère non-mot: [^ A-Za-z0-9_]
rubis? Correspond à "rub" ou "ruby": le y est facultatif
rubis* Correspond à "frotter" plus 0 ou plus de y
rubis + Correspond à "frotter" plus 1 ou plus de y
\\ d {3} Correspond exactement à 3 chiffres
\\ d {3,} Correspond à 3 chiffres ou plus
\\ d {3,5} Correspond à 3, 4 ou 5 chiffres
\\ D \\ d + Aucun groupe: + répète \\ d
(\\ D \\ d) + / Groupé: + répète \\ D \ d paire
([Rr] uby (,)?) + Correspond à "Ruby", "Ruby, ruby, ruby", etc.

Note- que chaque barre oblique inverse apparaît deux fois dans la chaîne ci-dessus. En effet, en Java et Scala, une seule barre oblique inverse est un caractère d'échappement dans une chaîne littérale, et non un caractère régulier qui apparaît dans la chaîne. Donc, au lieu de «\», vous devez écrire «\\» pour obtenir une seule barre oblique inverse dans la chaîne.

Essayez l'exemple de programme suivant.

Exemple

import scala.util.matching.Regex

object Demo {
   def main(args: Array[String]) {
      val pattern = new Regex("abl[ae]\\d+")
      val str = "ablaw is able1 and cool"
      
      println((pattern findAllIn str).mkString(","))
   }
}

Enregistrez le programme ci-dessus dans Demo.scala. Les commandes suivantes sont utilisées pour compiler et exécuter ce programme.

Commander

\>scalac Demo.scala
\>scala Demo

Production

able1