Ruby - Espressioni regolari
Un'espressione regolare è una sequenza di caratteri speciale che consente di abbinare o trovare altre stringhe o insiemi di stringhe utilizzando una sintassi specializzata, impartita in un modello.
Un letterale di espressione regolare è un modello tra barre o tra delimitatori arbitrari seguito da% r come segue:
Sintassi
/pattern/
/pattern/im # option can be specified
%r!/usr/local! # general delimited regular expression
Esempio
#!/usr/bin/ruby
line1 = "Cats are smarter than dogs";
line2 = "Dogs also like meat";
if ( line1 =~ /Cats(.*)/ )
puts "Line1 contains Cats"
end
if ( line2 =~ /Cats(.*)/ )
puts "Line2 contains Dogs"
end
Questo produrrà il seguente risultato:
Line1 contains Cats
Modificatori di espressioni regolari
I letterali delle espressioni regolari possono includere un modificatore opzionale per controllare vari aspetti della corrispondenza. Il modificatore è specificato dopo il secondo carattere barra, come mostrato in precedenza e può essere rappresentato da uno di questi caratteri -
Sr.No. | Modificatore e descrizione |
---|---|
1 | i Ignora maiuscole e minuscole durante la corrispondenza del testo. |
2 | o Esegue # {} interpolazioni solo una volta, la prima volta che viene valutato il valore letterale regexp. |
3 | x Ignora gli spazi e consente i commenti nelle espressioni regolari. |
4 | m Corrisponde a più righe, riconoscendo le nuove righe come caratteri normali. |
5 | u,e,s,n Interpreta la regexp come Unicode (UTF-8), EUC, SJIS o ASCII. Se nessuno di questi modificatori viene specificato, si presume che l'espressione regolare utilizzi la codifica sorgente. |
Come le stringhe letterali delimitate con% Q, Ruby ti permette di iniziare le tue espressioni regolari con% r seguito da un delimitatore a tua scelta. Questo è utile quando il pattern che stai descrivendo contiene molti caratteri barra in avanti che non vuoi sfuggire -
# Following matches a single slash character, no escape required
%r|/|
# Flag characters are allowed with this syntax, too
%r[</(.*)>]i
Modelli di espressioni regolari
Fatta eccezione per i personaggi di controllo, (+ ? . * ^ $ ( ) [ ] { } | \), tutti i personaggi corrispondono a se stessi. È possibile eseguire l'escape di un carattere di controllo precedendolo con una barra rovesciata.
Sr.No. | Modello e descrizione |
---|---|
1 | ^ Corrisponde all'inizio della riga. |
2 | $ Corrisponde alla fine della riga. |
3 | . Corrisponde a qualsiasi carattere singolo tranne la nuova riga. L'uso dell'opzione m consente anche di abbinare la nuova riga. |
4 | [...] Corrisponde a qualsiasi singolo carattere tra parentesi. |
5 | [^...] Corrisponde a qualsiasi carattere singolo non tra parentesi |
6 | re* Corrisponde a 0 o più occorrenze dell'espressione precedente. |
7 | re+ Corrisponde a 1 o più occorrenze dell'espressione precedente. |
8 | re? Corrisponde a 0 o 1 occorrenza dell'espressione precedente. |
9 | re{ n} Corrisponde esattamente al numero n di occorrenze dell'espressione precedente. |
10 | re{ n,} Corrisponde a n o più occorrenze dell'espressione precedente. |
11 | re{ n, m} Corrisponde ad almeno n e al massimo m occorrenze dell'espressione precedente. |
12 | a| b Corrisponde a a o b. |
13 | (re) Raggruppa le espressioni regolari e ricorda il testo corrispondente. |
14 | (?imx) Attiva temporaneamente le opzioni i, m o x all'interno di un'espressione regolare. Se tra parentesi, viene interessata solo quell'area. |
15 | (?-imx) Disattiva temporaneamente le opzioni i, m o x all'interno di un'espressione regolare. Se tra parentesi, viene interessata solo quell'area. |
16 | (?: re) Raggruppa le espressioni regolari senza ricordare il testo corrispondente. |
17 | (?imx: re) Attiva temporaneamente le opzioni i, m o x tra parentesi. |
18 | (?-imx: re) Disattiva temporaneamente le opzioni i, m o x tra parentesi. |
19 | (?#...) Commento. |
20 | (?= re) Specifica la posizione utilizzando un modello. Non ha una gamma. |
21 | (?! re) Specifica la posizione utilizzando la negazione del modello. Non ha una gamma. |
22 | (?> re) Corrisponde a pattern indipendenti senza backtracking. |
23 | \w Corrisponde ai caratteri delle parole. |
24 | \W Corrisponde a caratteri non di parole. |
25 | \s Corrisponde allo spazio bianco. Equivalente a [\ t \ n \ r \ f]. |
26 | \S Corrisponde a spazi non bianchi. |
27 | \d Corrisponde alle cifre. Equivalente a [0-9]. |
28 | \D Corrisponde a non cifre. |
29 | \A Corrisponde all'inizio della stringa. |
30 | \Z Corrisponde alla fine della stringa. Se esiste una nuova riga, corrisponde appena prima della nuova riga. |
31 | \z Corrisponde alla fine della stringa. |
32 | \G Punto delle partite in cui è finita l'ultima partita. |
33 | \b Corrisponde ai confini delle parole quando sono al di fuori delle parentesi. Corrisponde a backspace (0x08) quando è racchiuso tra parentesi. |
34 | \B Corrisponde ai confini non di parole. |
35 | \n, \t, etc. Trova nuove righe, ritorni a capo, tabulazioni, ecc. |
36 | \1...\9 Corrisponde all'ennesima sottoespressione raggruppata. |
37 | \10 Corrisponde all'ennesima sottoespressione raggruppata se corrisponde già. Altrimenti si riferisce alla rappresentazione ottale di un codice carattere. |
Esempi di espressioni regolari
Sr.No. | Esempio e descrizione |
---|---|
1 | /ruby/ Corrisponde a "ruby". |
2 | ¥ Corrisponde al segno di yen. I caratteri multibyte sono supportati in Ruby 1.9 e Ruby 1.8. |
Sr.No. | Esempio e descrizione |
---|---|
1 | /[Rr]uby/ Corrisponde a "Ruby" o "ruby". |
2 | /rub[ye]/ Corrisponde a "ruby" o "rube". |
3 | /[aeiou]/ Corrisponde a una vocale qualsiasi minuscola. |
4 | /[0-9]/ Corrisponde a qualsiasi cifra; uguale a / [0123456789] /. |
5 | /[a-z]/ Corrisponde a qualsiasi lettera ASCII minuscola. |
6 | /[A-Z]/ Corrisponde a qualsiasi lettera ASCII maiuscola. |
7 | /[a-zA-Z0-9]/ Corrisponde a uno dei precedenti. |
8 | /[^aeiou]/ Corrisponde a qualsiasi cosa diversa da una vocale minuscola. |
9 | /[^0-9]/ Corrisponde a qualsiasi cosa diversa da una cifra. |
Sr.No. | Esempio e descrizione |
---|---|
1 | /./ Corrisponde a qualsiasi carattere tranne la nuova riga. |
2 | /./m In modalità multilinea, corrisponde anche alla nuova riga. |
3 | /\d/ Corrisponde a una cifra: / [0-9] /. |
4 | /\D/ Corrisponde a una non cifra: / [^ 0-9] /. |
5 | /\s/ Corrisponde a uno spazio vuoto: / [\ t \ r \ n \ f] /. |
6 | /\S/ Corrisponde a spazi diversi da spazi: / [^ \ t \ r \ n \ f] /. |
7 | /\w/ Corrisponde a un carattere di una sola parola: / [A-Za-z0-9 _] /. |
8 | /\W/ Corrisponde a un carattere non alfanumerico: / [^ A-Za-z0-9 _] /. |
Sr.No. | Esempio e descrizione |
---|---|
1 | /ruby?/ Corrisponde a "rub" o "ruby": la y è facoltativa. |
2 | /ruby*/ Corrisponde a "strofinare" più 0 o più anni. |
3 | /ruby+/ Corrisponde a "strofinare" più 1 o più anni. |
4 | /\d{3}/ Corrisponde esattamente a 3 cifre. |
5 | /\d{3,}/ Corrisponde a 3 o più cifre. |
6 | /\d{3,5}/ Corrisponde a 3, 4 o 5 cifre. |
Questo corrisponde al minor numero di ripetizioni -
Sr.No. | Esempio e descrizione |
---|---|
1 | /<.*>/ Ripetizione avida: corrisponde a "<ruby> perl>". |
2 | /<.*?>/ Non avido: trova "<ruby>" in "<ruby> perl>". |
Sr.No. | Esempio e descrizione |
---|---|
1 | /\D\d+/ Nessun gruppo: + si ripete \ d |
2 | /(\D\d)+/ Raggruppato: + ripete la coppia \ D \ d |
3 | /([Rr]uby(, )?)+/ Abbina "Ruby", "Ruby, ruby, ruby" e così via. |
Questo corrisponde di nuovo a un gruppo precedentemente abbinato -
Sr.No. | Esempio e descrizione |
---|---|
1 | /([Rr])uby&\1ails/ Abbina Ruby & Rails o Ruby & Rails. |
2 | /(['"])(?:(?!\1).)*\1/ Stringa tra virgolette singole o doppie. \ 1 corrisponde a qualsiasi corrispondenza del primo gruppo. \ 2 corrisponde a qualunque sia il 2 ° gruppo abbinato, ecc. |
Sr.No. | Esempio e descrizione |
---|---|
1 | /ruby|rube/ Corrisponde a "ruby" o "rube". |
2 | /rub(y|le))/ Corrisponde a "rubino" o "rublo". |
3 | /ruby(!+|\?)/ "rubino" seguito da uno o più! o uno? |
Deve specificare la posizione della partita.
Sr.No. | Esempio e descrizione |
---|---|
1 | /^Ruby/ Trova "Ruby" all'inizio di una stringa o di una riga interna. |
2 | /Ruby$/ Corrisponde a "Ruby" alla fine di una stringa o di una riga. |
3 | /\ARuby/ Trova "Ruby" all'inizio di una stringa. |
4 | /Ruby\Z/ Corrisponde a "Ruby" alla fine di una stringa. |
5 | /\bRuby\b/ Corrisponde a "Ruby" al confine di una parola. |
6 | /\brub\B/ \ B è un confine non di parola: trova "rub" in "rube" e "ruby" ma non da solo. |
7 | /Ruby(?=!)/ Corrisponde a "Ruby", se seguito da un punto esclamativo. |
8 | /Ruby(?!!)/ Corrisponde a "Ruby", se non seguito da un punto esclamativo. |
Sr.No. | Esempio e descrizione |
---|---|
1 | /R(?#comment)/ Corrisponde a "R". Tutto il resto è un commento. |
2 | /R(?i)uby/ Non distingue tra maiuscole e minuscole durante la corrispondenza di "uby". |
3 | /R(?i:uby)/ Come sopra. |
4 | /rub(?:y|le))/ Raggruppa solo senza creare \ 1 backreference. |
Cerca e sostituisci
Alcuni dei metodi String più importanti che utilizzano espressioni regolari sono sub e gsube le loro varianti sul posto sub! e gsub!.
Tutti questi metodi eseguono un'operazione di ricerca e sostituzione utilizzando un pattern Regexp. Ilsub & sub! sostituisce la prima occorrenza del modello e gsub & gsub! sostituisce tutte le occorrenze.
Il sub e gsub restituisce una nuova stringa, lasciando quella originale non modificata dove come sub! e gsub! modificare la stringa su cui vengono chiamati.
Di seguito è riportato l'esempio:
#!/usr/bin/ruby
phone = "2004-959-559 #This is Phone Number"
# Delete Ruby-style comments
phone = phone.sub!(/#.*$/, "")
puts "Phone Num : #{phone}"
# Remove anything other than digits
phone = phone.gsub!(/\D/, "")
puts "Phone Num : #{phone}"
Questo produrrà il seguente risultato:
Phone Num : 2004-959-559
Phone Num : 2004959559
Di seguito è riportato un altro esempio:
#!/usr/bin/ruby
text = "rails are rails, really good Ruby on Rails"
# Change "rails" to "Rails" throughout
text.gsub!("rails", "Rails")
# Capitalize the word "Rails" throughout
text.gsub!(/\brails\b/, "Rails")
puts "#{text}"
Questo produrrà il seguente risultato:
Rails are Rails, really good Ruby on Rails