Ruby - Stringhe
Un oggetto String in Ruby contiene e manipola una sequenza arbitraria di uno o più byte, che tipicamente rappresentano caratteri che rappresentano il linguaggio umano.
Le stringhe letterali più semplici sono racchiuse tra virgolette singole (il carattere apostrofo). Il testo tra virgolette è il valore della stringa -
'This is a simple Ruby string literal'
Se è necessario inserire un apostrofo all'interno di una stringa letterale tra virgolette singole, anteporla a una barra rovesciata, in modo che l'interprete Ruby non pensi di terminare la stringa -
'Won\'t you read O\'Reilly\'s book?'
Il backslash funziona anche per sfuggire a un altro backslash, in modo che il secondo backslash non venga interpretato come un carattere di escape.
Di seguito sono riportate le funzionalità relative alle stringhe di Ruby.
Sostituzione di espressioni
La sostituzione dell'espressione è un mezzo per incorporare il valore di qualsiasi espressione Ruby in una stringa usando # {e} -
#!/usr/bin/ruby
x, y, z = 12, 36, 72
puts "The value of x is #{ x }."
puts "The sum of x and y is #{ x + y }."
puts "The average was #{ (x + y + z)/3 }."
Questo produrrà il seguente risultato:
The value of x is 12.
The sum of x and y is 48.
The average was 40.
Stringhe delimitate generali
Con stringhe delimitate generali, puoi creare stringhe all'interno di una coppia di caratteri delimitatori corrispondenti sebbene arbitrari, ad es.!, (, {, <, Ecc., Preceduti da un carattere di percentuale (%). Q, q e x hanno significati speciali . Le stringhe delimitate generali possono essere -
%{Ruby is fun.} equivalent to "Ruby is fun."
%Q{ Ruby is fun. } equivalent to " Ruby is fun. "
%q[Ruby is fun.] equivalent to a single-quoted string
%x!ls! equivalent to back tick command output `ls`
Caratteri di fuga
NOTE- In una stringa tra virgolette doppie, viene interpretato un carattere di escape; in una stringa tra virgolette singole, viene conservato un carattere di escape.
Notazione backslash | Carattere esadecimale | Descrizione |
---|---|---|
\un | 0x07 | Campanello o avviso |
\ b | 0x08 | Backspace |
\ cx | Control-x | |
\ Cx | Control-x | |
\ e | 0x1b | Fuga |
\ f | 0x0c | Formfeed |
\ M- \ Cx | Meta-Control-x | |
\ n | 0x0a | Nuova linea |
\ nnn | Notazione ottale, dove n è compreso tra 0,7 | |
\ r | 0x0d | Ritorno in carrozza |
\S | 0x20 | Spazio |
\ t | 0x09 | Tab |
\ v | 0x0b | Tab verticale |
\X | Carattere x | |
\ xnn | Notazione esadecimale, dove n è compreso tra 0,9, af o AF |
Codifica dei caratteri
Il set di caratteri predefinito per Ruby è ASCII, i cui caratteri possono essere rappresentati da singoli byte. Se si utilizza UTF-8 o un altro set di caratteri moderno, i caratteri possono essere rappresentati da uno a quattro byte.
Puoi cambiare il tuo set di caratteri usando $ KCODE all'inizio del tuo programma, in questo modo:
$KCODE = 'u'
Sr.No. | Codice e descrizione |
---|---|
1 | a ASCII (uguale a nessuno). Questa è l'impostazione predefinita. |
2 | e EUC. |
3 | n Nessuno (come ASCII). |
4 | u UTF-8. |
Metodi incorporati di stringa
Abbiamo bisogno di un'istanza dell'oggetto String per chiamare un metodo String. Di seguito è riportato il modo per creare un'istanza di un oggetto String:
new [String.new(str = "")]
Ciò restituirà un nuovo oggetto stringa contenente una copia di str . Ora, usando str object, possiamo tutti usare qualsiasi metodo di istanza disponibile. Ad esempio:
#!/usr/bin/ruby
myStr = String.new("THIS IS TEST")
foo = myStr.downcase
puts "#{foo}"
Questo produrrà il seguente risultato:
this is test
Sr.No. | Metodi e descrizione |
---|---|
1 | str % arg Formatta una stringa utilizzando una specifica di formato. arg deve essere un array se contiene più di una sostituzione. Per informazioni sulla specifica del formato, vedere sprintf in "Modulo kernel". |
2 | str * integer Restituisce una nuova stringa contenente un numero intero moltiplicato per str. In altre parole, str è un numero intero ripetuto. |
3 | str + other_str Concatena other_str a str. |
4 | str << obj Concatena un oggetto a str. Se l'oggetto è un numero fisso nell'intervallo 0,255, viene convertito in un carattere. Confrontalo con concat. |
5 | str <=> other_str Confronta str con other_str, restituendo -1 (minore di), 0 (uguale) o 1 (maggiore di). Il confronto fa distinzione tra maiuscole e minuscole. |
6 | str == obj Verifica l'uguaglianza di str e obj. Se obj non è una stringa, restituisce false; restituisce true se str <=> obj restituisce 0. |
7 | str =~ obj Confronta str con un modello di espressione regolare obj. Restituisce la posizione in cui inizia la partita; in caso contrario, false. |
8 | str.capitalize Capitalizza una stringa. |
9 | str.capitalize! Uguale a capitalize, ma le modifiche vengono apportate sul posto. |
10 | str.casecmp Effettua un confronto tra le stringhe senza distinzione tra maiuscole e minuscole. |
11 | str.center Centra una stringa. |
12 | str.chomp Rimuove il separatore di record ($ /), solitamente \ n, dalla fine di una stringa. Se non esiste alcun separatore di record, non fa nulla. |
13 | str.chomp! Uguale a chomp, ma le modifiche vengono apportate sul posto. |
14 | str.chop Rimuove l'ultimo carattere in str. |
15 | str.chop! Uguale a chop, ma le modifiche vengono apportate sul posto. |
16 | str.concat(other_str) Concatena other_str a str. |
17 | str.count(str, ...) Conta uno o più set di caratteri. Se è presente più di un set di caratteri, conta l'intersezione di tali set |
18 | str.crypt(other_str) Applica un hash crittografico unidirezionale a str. L'argomento è la stringa salt, che dovrebbe essere lunga due caratteri, ogni carattere nell'intervallo az, AZ, 0.9,. o /. |
19 | str.delete(other_str, ...) Restituisce una copia di str con tutti i caratteri nell'intersezione dei suoi argomenti eliminati. |
20 | str.delete!(other_str, ...) Uguale a Elimina, ma le modifiche vengono apportate sul posto. |
21 | str.downcase Restituisce una copia di str con tutte le lettere maiuscole sostituite da minuscole. |
22 | str.downcase! Uguale al downcase, ma le modifiche vengono apportate. |
23 | str.dump Restituisce una versione di str con tutti i caratteri non stampabili sostituiti dalla notazione \ nnn e tutti i caratteri speciali con escape. |
24 | str.each(separator = $/) { |substr| block } Divide str utilizzando l'argomento come separatore di record ($ / per impostazione predefinita), passando ogni sottostringa al blocco fornito. |
25 | str.each_byte { |fixnum| block } Passa ogni byte da str al blocco, restituendo ogni byte come rappresentazione decimale del byte. |
26 | str.each_line(separator=$/) { |substr| block } Divide str utilizzando l'argomento come separatore di record ($ / per impostazione predefinita), passando ogni sottostringa al blocco fornito. |
27 | str.empty? Restituisce vero se str è vuoto (ha lunghezza zero). |
28 | str.eql?(other) Due stringhe sono uguali se hanno la stessa lunghezza e contenuto. |
29 | str.gsub(pattern, replacement) [or] str.gsub(pattern) { |match| block } Restituisce una copia di str con tutte le occorrenze di pattern sostituite con la sostituzione o il valore del blocco. Il pattern sarà tipicamente un Regexp; se è una stringa, non verranno interpretati i metacaratteri delle espressioni regolari (ovvero / \ d / corrisponderà a una cifra, ma "\ d" corrisponderà a una barra rovesciata seguita da una "d") |
30 | str[fixnum] [or] str[fixnum,fixnum] [or] str[range] [or] str[regexp] [or] str[regexp, fixnum] [or] str[other_str] Fa riferimento a str, utilizzando i seguenti argomenti: one Fixnum, restituisce un codice carattere in fixnum; due Fixnum, restituisce una sottostringa a partire da un offset (primo fixnum) fino a length (secondo fixnum); intervallo, restituisce una sottostringa nell'intervallo; regexp restituisce una parte della stringa corrispondente; regexp con fixnum, restituisce i dati corrispondenti a fixnum; other_str restituisce la sottostringa che corrisponde a other_str. Un Fixnum negativo inizia alla fine della stringa con -1. |
31 | str[fixnum] = fixnum [or] str[fixnum] = new_str [or] str[fixnum, fixnum] = new_str [or] str[range] = aString [or] str[regexp] = new_str [or] str[regexp, fixnum] = new_str [or] str[other_str] = new_str ] Sostituisci (assegna) tutto o parte di una stringa. Sinonimo di slice !. |
32 | str.gsub!(pattern, replacement) [or] str.gsub!(pattern) { |match|block } Esegue le sostituzioni di String # gsub in posizione, restituendo str o nil se non sono state eseguite sostituzioni. |
33 | str.hash Restituisce un hash in base alla lunghezza e al contenuto della stringa. |
34 | str.hex Tratta i caratteri iniziali di str come una stringa di cifre esadecimali (con un segno facoltativo e uno 0x facoltativo) e restituisce il numero corrispondente. Zero viene restituito in caso di errore. |
35 | str.include? other_str [or] str.include? fixnum Restituisce vero se str contiene la stringa o il carattere specificato. |
36 | str.index(substring [, offset]) [or] str.index(fixnum [, offset]) [or] str.index(regexp [, offset]) Restituisce l'indice della prima occorrenza della sottostringa, del carattere (fixnum) o del pattern (regexp) in str. Restituisce zero se non trovato. Se è presente il secondo parametro, specifica la posizione nella stringa per iniziare la ricerca. |
37 | str.insert(index, other_str) Inserisce altro_str prima del carattere all'indice dato, modificando str. Gli indici negativi contano dalla fine della stringa e vengono inseriti dopo il carattere specificato. L'intento è inserire una stringa in modo che inizi dall'indice specificato. |
38 | str.inspect Restituisce una versione stampabile di str, con caratteri speciali di escape. |
39 | str.intern [or] str.to_sym Restituisce il Simbolo corrispondente a str, creando il simbolo se non esisteva in precedenza. |
40 | str.length Restituisce la lunghezza di str. Confronta le dimensioni. |
41 | str.ljust(integer, padstr = ' ') Se intero è maggiore della lunghezza di str, restituisce una nuova stringa di lunghezza intero con str allineato a sinistra e riempito con padstr; in caso contrario, restituisce str. |
42 | str.lstrip Restituisce una copia di str con gli spazi iniziali rimossi. |
43 | str.lstrip! Rimuove gli spazi bianchi iniziali da str, restituendo nil se non è stata apportata alcuna modifica. |
44 | str.match(pattern) Converte pattern in un Regexp (se non lo è già), quindi invoca il suo metodo match su str. |
45 | str.oct Tratta i caratteri iniziali di str come una stringa di cifre ottali (con un segno opzionale) e restituisce il numero corrispondente. Restituisce 0 se la conversione non riesce. |
46 | str.replace(other_str) Sostituisce il contenuto e la contaminazione di str con i valori corrispondenti in other_str. |
47 | str.reverse Restituisce una nuova stringa con i caratteri di str in ordine inverso. |
48 | str.reverse! Inverte str in posizione. |
49 | str.rindex(substring [, fixnum]) [or] str.rindex(fixnum [, fixnum]) [or] str.rindex(regexp [, fixnum]) Restituisce l'indice dell'ultima occorrenza della sottostringa, del carattere (fixnum) o del pattern (regexp) in str. Restituisce zero se non trovato. Se il secondo parametro è presente, specifica la posizione nella stringa per terminare la ricerca. I caratteri oltre questo punto non verranno considerati. |
50. | str.rjust(integer, padstr = ' ') Se intero è maggiore della lunghezza di str, restituisce una nuova stringa di lunghezza intero con str giustificato a destra e riempito con padstr; in caso contrario, restituisce str. |
51 | str.rstrip Restituisce una copia di str con gli spazi vuoti finali rimossi. |
52 | str.rstrip! Rimuove gli spazi vuoti finali da str, restituendo zero se non è stata apportata alcuna modifica. |
53 | str.scan(pattern) [or] str.scan(pattern) { |match, ...| block } Entrambe le forme eseguono l'iterazione attraverso str, corrispondenti al modello (che può essere un Regexp o una String). Per ogni corrispondenza, viene generato un risultato e aggiunto all'array dei risultati o passato al blocco. Se il pattern non contiene gruppi, ogni singolo risultato è costituito dalla stringa corrispondente, $ &. Se il pattern contiene gruppi, ogni singolo risultato è esso stesso un array contenente una voce per gruppo. |
54 | str.slice(fixnum) [or] str.slice(fixnum, fixnum) [or] str.slice(range) [or] str.slice(regexp) [or] str.slice(regexp, fixnum) [or] str.slice(other_str) See str[fixnum], etc. str.slice!(fixnum) [or] str.slice!(fixnum, fixnum) [or] str.slice!(range) [or] str.slice!(regexp) [or] str.slice!(other_str) Elimina la parte specificata da str e restituisce la parte eliminata. I form che accettano un Fixnum solleveranno un IndexError se il valore è fuori intervallo; il modulo Range solleverà un RangeError e i form Regexp e String ignoreranno silenziosamente l'assegnazione. |
55 | str.split(pattern = $, [limit]) Divide str in sottostringhe in base a un delimitatore, restituendo un array di queste sottostringhe. Se pattern è una stringa, il suo contenuto viene utilizzato come delimitatore quando si divide str. Se pattern è un singolo spazio, str viene diviso su spazi bianchi, con spazi bianchi iniziali e sequenze di caratteri di spazi vuoti contigui ignorati. Se pattern è un'espressione regolare, str è diviso nel punto in cui il pattern corrisponde. Ogni volta che il modello corrisponde a una stringa di lunghezza zero, str viene suddiviso in singoli caratteri. Se pattern viene omesso, il valore di$; is used. If $; è nil (che è l'impostazione predefinita), str è suddiviso in spazi bianchi come se fosse specificato ``. Se il parametro limit viene omesso, i campi nulli finali vengono soppressi. Se limite è un numero positivo, verrà restituito al massimo quel numero di campi (se limite è 1, l'intera stringa viene restituita come unica voce in un array). Se negativo, non vi è alcun limite al numero di campi restituiti e i campi nulli finali non vengono soppressi. |
56 | str.squeeze([other_str]*) Crea un set di caratteri dai parametri other_str utilizzando la procedura descritta per String # count. Restituisce una nuova stringa in cui le esecuzioni dello stesso carattere che si verificano in questo set vengono sostituite da un singolo carattere. Se non vengono forniti argomenti, tutte le sequenze di caratteri identici vengono sostituite da un singolo carattere. |
57 | str.squeeze!([other_str]*) Comprime str in posizione, restituendo str o nil se non sono state apportate modifiche. |
58 | str.strip Restituisce una copia di str con gli spazi iniziali e finali rimossi. |
59 | str.strip! Rimuove gli spazi bianchi iniziali e finali da str. Restituisce nil se str non è stato alterato. |
60 | str.sub(pattern, replacement) [or] str.sub(pattern) { |match| block } Restituisce una copia di str con la prima occorrenza di pattern sostituita con la sostituzione o il valore del blocco. Il pattern sarà tipicamente un Regexp; se è una stringa, non verranno interpretati i metacaratteri delle espressioni regolari. |
61 | str.sub!(pattern, replacement) [or] str.sub!(pattern) { |match| block } Esegue le sostituzioni di String # sub in posizione, restituendo str o nil se non sono state eseguite sostituzioni. |
62 | str.succ [or] str.next Restituisce il successore a str. |
63 | str.succ! [or] str.next! Equivalente a String # succ, ma modifica il ricevitore in posizione. |
64 | str.sum(n = 16) Restituisce un checksum di base in n bit dei caratteri in str, dove n è il parametro Fixnum opzionale, predefinito a 16. Il risultato è semplicemente la somma del valore binario di ogni carattere in str modulo 2n - 1. Questo non è un particolare buon checksum. |
65 | str.swapcase Restituisce una copia di str con caratteri alfabetici maiuscoli convertiti in caratteri minuscoli e minuscoli convertiti in maiuscoli. |
66 | str.swapcase! Equivalente a String # swapcase, ma modifica il ricevitore in posizione, restituendo str o nil se non sono state apportate modifiche. |
67 | str.to_f > Restituisce il risultato dell'interpretazione dei caratteri iniziali in str come un numero a virgola mobile. I caratteri estranei oltre la fine di un numero valido vengono ignorati. Se non è presente un numero valido all'inizio di str, viene restituito 0.0. Questo metodo non genera mai un'eccezione. |
68 | str.to_i(base = 10) Restituisce il risultato dell'interpretazione dei caratteri iniziali in str come una base intera (base 2, 8, 10 o 16). I caratteri estranei oltre la fine di un numero valido vengono ignorati. Se non c'è un numero valido all'inizio di str, viene restituito 0. Questo metodo non genera mai un'eccezione. |
69 | str.to_s [or] str.to_str Restituisce il ricevitore. |
70 | str.tr(from_str, to_str) Restituisce una copia di str con i caratteri in from_str sostituiti dai caratteri corrispondenti in to_str. Se to_str è più corto di from_str, viene riempito con il suo ultimo carattere. Entrambe le stringhe possono utilizzare la notazione c1.c2 per indicare intervalli di caratteri e from_str può iniziare con ^, che denota tutti i caratteri tranne quelli elencati. |
71 | str.tr!(from_str, to_str) Traduce str in posizione, utilizzando le stesse regole di String # tr. Restituisce str o nil se non sono state apportate modifiche. |
72 | str.tr_s(from_str, to_str) Elabora una copia di str come descritto in String # tr, quindi rimuove i caratteri duplicati nelle aree interessate dalla traduzione. |
73 | str.tr_s!(from_str, to_str) Esegue l'elaborazione String # tr_s su str in posizione, restituendo str o nil se non sono state apportate modifiche. |
74 | str.unpack(format) > Decodifica str (che può contenere dati binari) in base alla stringa di formato, restituendo un array di ogni valore estratto. La stringa di formato consiste in una sequenza di direttive di un carattere, riassunte nella Tabella 18. Ciascuna direttiva può essere seguita da un numero, che indica il numero di volte da ripetere con questa direttiva. Un asterisco (*) utilizzerà tutti gli elementi rimanenti. Ciascuna delle direttive sSiIlL può essere seguita da un trattino basso (_) per utilizzare la dimensione nativa della piattaforma sottostante per il tipo specificato; in caso contrario, utilizza una dimensione coerente indipendente dalla piattaforma. Gli spazi vengono ignorati nella stringa di formato. |
75 | str.upcase Restituisce una copia di str con tutte le lettere minuscole sostituite con le loro controparti maiuscole. L'operazione è insensibile alle impostazioni locali. Sono interessati solo i caratteri dalla a alla z. |
76 | str.upcase! Cambia il contenuto di str in maiuscolo, restituendo nil se non vengono apportate modifiche. |
77 | str.upto(other_str) { |s| block } Scorre i valori successivi, iniziando da str e finendo in other_str incluso, passando ogni valore a turno al blocco. Il metodo String # succ viene utilizzato per generare ogni valore. |
Direttive di decompressione delle stringhe
Direttiva | ritorna | Descrizione |
---|---|---|
UN | Corda | Con i valori nulli finali e gli spazi rimossi. |
un | Corda | Corda. |
B | Corda | Estrae bit da ogni carattere (prima il bit più significativo). |
b | Corda | Estrae bit da ogni carattere (prima il bit meno significativo). |
C | Fixnum | Estrae un carattere come numero intero senza segno. |
c | Fixnum | Estrae un carattere come numero intero. |
D, d | Galleggiante | Tratta sizeof (double) caratteri come un double nativo. |
E | Galleggiante | Tratta la dimensione dei caratteri (doppi) come un doppio nell'ordine dei byte littleendian. |
e | Galleggiante | Tratta la dimensione dei caratteri (float) come un float nell'ordine dei byte littleendian. |
F, f | Galleggiante | Tratta i caratteri sizeof (float) come un float nativo. |
G | Galleggiante | Considera la dimensione dei caratteri (doppi) come un doppio nell'ordine dei byte di rete. |
g | Corda | Considera la dimensione dei caratteri (float) come un float nell'ordine dei byte di rete. |
H | Corda | Estrae bocconcini esadecimali da ogni personaggio (prima il bit più significativo) |
h | Corda | Estrae bocconcini esadecimali da ogni personaggio (prima il bit meno significativo). |
io | Numero intero | Considera sizeof (int) (modificato da _) i caratteri successivi come un numero intero nativo senza segno. |
io | Numero intero | Considera sizeof (int) (modificato da _) i caratteri successivi come un intero nativo con segno. |
L | Numero intero | Tratta quattro caratteri successivi (modificati da _) come un intero lungo nativo senza segno. |
l | Numero intero | Tratta quattro caratteri successivi (modificati da _) come un intero lungo nativo con segno. |
M | Corda | Quotato stampabile. |
m | Corda | Codifica Base64. |
N | Numero intero | Considera quattro caratteri come un long senza segno nell'ordine dei byte di rete. |
n | Fixnum | Considera due caratteri come un corto senza segno nell'ordine dei byte di rete. |
P | Corda | Tratta i caratteri sizeof (char *) come un puntatore e restituisce i caratteri \ emph {len} dalla posizione di riferimento. |
p | Corda | Considera sizeof (char *) caratteri come un puntatore a una stringa con terminazione null. |
Q | Numero intero | Considera otto caratteri come una parola quadrupla senza segno (64 bit). |
q | Numero intero | Tratta otto caratteri come una parola quadrupla con segno (64 bit). |
S | Fixnum | Tratta due caratteri successivi (diversi se utilizzati _) come abbreviazioni senza segno nell'ordine dei byte nativo. |
S | Fixnum | Tratta due caratteri successivi (diversi se utilizzati _) come abbreviazioni con segno nell'ordine dei byte nativo. |
U | Numero intero | Caratteri UTF-8 come numeri interi senza segno. |
u | Corda | Codifica UU. |
V | Fixnum | Tratta quattro caratteri come un long senza segno in ordine di byte little-endian. |
v | Fixnum | Tratta due caratteri come un abbreviazione senza segno in ordine di byte little-endian. |
w | Numero intero | Intero compresso con BER. |
X | Salta indietro di un carattere. | |
X | Salta avanti di un carattere. | |
Z | Corda | Con i valori nulli finali rimossi fino al primo nullo con *. |
@ | Salta all'offset fornito dall'argomento length. |
Esempio
Prova il seguente esempio per decomprimere vari dati.
"abc \0\0abc \0\0".unpack('A6Z6') #=> ["abc", "abc "]
"abc \0\0".unpack('a3a3') #=> ["abc", " \000\000"]
"abc \0abc \0".unpack('Z*Z*') #=> ["abc ", "abc "]
"aa".unpack('b8B8') #=> ["10000110", "01100001"]
"aaa".unpack('h2H2c') #=> ["16", "61", 97]
"\xfe\xff\xfe\xff".unpack('sS') #=> [-2, 65534]
"now = 20is".unpack('M*') #=> ["now is"]
"whole".unpack('xax2aX2aX1aX2a') #=> ["h", "e", "l", "l", "o"]