Ruby - Ekspresi Reguler

Sebuah ekspresi reguler adalah urutan khusus karakter yang membantu Anda mencocokkan atau menemukan string lain atau set string menggunakan sintaks khusus yang diadakan di pola.

Sebuah ekspresi literal reguler adalah pola antara garis miring atau antara pembatas sewenang-wenang diikuti oleh% r sebagai berikut -

Sintaksis

/pattern/
/pattern/im    # option can be specified
%r!/usr/local! # general delimited regular expression

Contoh

#!/usr/bin/ruby

line1 = "Cats are smarter than dogs";
line2 = "Dogs also like meat";

if ( line1 =~ /Cats(.*)/ )
   puts "Line1 contains Cats"
end
if ( line2 =~ /Cats(.*)/ )
   puts "Line2 contains  Dogs"
end

Ini akan menghasilkan hasil sebagai berikut -

Line1 contains Cats

Pengubah Ekspresi Reguler

Literal ekspresi reguler dapat menyertakan pengubah opsional untuk mengontrol berbagai aspek pencocokan. Pengubah ditentukan setelah karakter garis miring kedua, seperti yang ditunjukkan sebelumnya dan dapat diwakili oleh salah satu karakter ini -

Sr.No. Pengubah & Deskripsi
1

i

Abaikan kapitalisasi saat mencocokkan teks.

2

o

Melakukan # {} interpolasi hanya sekali, pertama kali literal regexp dievaluasi.

3

x

Mengabaikan spasi kosong dan mengizinkan komentar dalam ekspresi reguler.

4

m

Mencocokkan beberapa baris, mengenali baris baru sebagai karakter normal.

5

u,e,s,n

Menafsirkan regexp sebagai Unicode (UTF-8), EUC, SJIS, atau ASCII. Jika tidak ada pengubah ini yang ditentukan, ekspresi reguler diasumsikan menggunakan pengkodean sumber.

Seperti literal string yang dipisahkan dengan% Q, Ruby memungkinkan Anda untuk memulai ekspresi reguler dengan% r diikuti dengan pembatas pilihan Anda. Ini berguna ketika pola yang Anda gambarkan berisi banyak karakter garis miring ke depan yang tidak ingin Anda hilangkan -

# Following matches a single slash character, no escape required
%r|/|

# Flag characters are allowed with this syntax, too
%r[</(.*)>]i

Pola Ekspresi Reguler

Kecuali untuk karakter kontrol, (+ ? . * ^ $ ( ) [ ] { } | \), semua karakter cocok dengan dirinya sendiri. Anda dapat meloloskan diri dari karakter kontrol dengan mengawalinya dengan garis miring terbalik.

Sr.No. Pola & Deskripsi
1

^

Cocok di awal baris.

2

$

Pertandingan akhir baris.

3

.

Cocok dengan satu karakter apa pun kecuali baris baru. Menggunakan opsi m memungkinkannya untuk mencocokkan baris baru juga.

4

[...]

Mencocokkan salah satu karakter dalam tanda kurung.

5

[^...]

Cocok dengan satu karakter apa pun yang tidak ada dalam tanda kurung

6

re*

Cocok dengan 0 atau lebih kemunculan ekspresi sebelumnya.

7

re+

Cocok dengan 1 atau lebih kemunculan ekspresi sebelumnya.

8

re?

Cocok dengan 0 atau 1 kemunculan ekspresi sebelumnya.

9

re{ n}

Cocok persis dengan n jumlah kemunculan ekspresi sebelumnya.

10

re{ n,}

Cocok dengan n atau lebih kemunculan ekspresi sebelumnya.

11

re{ n, m}

Cocok setidaknya n dan paling banyak m kemunculan ekspresi sebelumnya.

12

a| b

Cocok dengan a atau b.

13

(re)

Kelompokkan ekspresi reguler dan ingat teks yang cocok.

14

(?imx)

Mengaktifkan sementara opsi i, m, atau x dalam ekspresi reguler. Jika di dalam tanda kurung, hanya area tersebut yang terpengaruh.

15

(?-imx)

Menonaktifkan sementara opsi i, m, atau x dalam ekspresi reguler. Jika di dalam tanda kurung, hanya area tersebut yang terpengaruh.

16

(?: re)

Kelompokkan ekspresi reguler tanpa mengingat teks yang cocok.

17

(?imx: re)

Mengaktifkan sementara opsi i, m, atau x dalam tanda kurung.

18

(?-imx: re)

Matikan sementara opsi i, m, atau x dalam tanda kurung.

19

(?#...)

Komentar.

20

(?= re)

Menentukan posisi menggunakan pola. Tidak memiliki jangkauan.

21

(?! re)

Menentukan posisi menggunakan negasi pola. Tidak memiliki jangkauan.

22

(?> re)

Mencocokkan pola independen tanpa mundur.

23

\w

Cocok dengan karakter kata.

24

\W

Cocok dengan karakter bukan kata.

25

\s

Cocok dengan spasi. Setara dengan [\ t \ n \ r \ f].

26

\S

Cocok dengan nonwhitespace.

27

\d

Cocok dengan angka. Setara dengan [0-9].

28

\D

Cocok dengan nondigits.

29

\A

Cocok dengan awal string.

30

\Z

Cocok dengan ujung string. Jika ada baris baru, itu cocok sebelum baris baru.

31

\z

Cocok dengan ujung string.

32

\G

Mencocokkan poin di mana pertandingan terakhir selesai.

33

\b

Mencocokkan batas kata saat berada di luar tanda kurung. Cocok dengan spasi mundur (0x08) saat berada di dalam tanda kurung.

34

\B

Cocok dengan batas non-kata.

35

\n, \t, etc.

Cocok dengan baris baru, carriage return, tab, dll.

36

\1...\9

Cocok dengan subekspresi yang dikelompokkan ke-n.

37

\10

Cocok dengan subekspresi yang dikelompokkan ke-n jika sudah cocok. Jika tidak mengacu pada representasi oktal dari kode karakter.

Contoh Ekspresi Reguler

Sr.No. Contoh & Deskripsi
1

/ruby/

Cocok dengan "ruby".

2

¥

Cocok dengan tanda Yen. Karakter multibyte didukung di Ruby 1.9 dan Ruby 1.8.

Sr.No. Contoh & Deskripsi
1

/[Rr]uby/

Cocok dengan "Ruby" atau "ruby".

2

/rub[ye]/

Cocok dengan "ruby" atau "rube".

3

/[aeiou]/

Cocok dengan salah satu vokal huruf kecil.

4

/[0-9]/

Cocok dengan angka apa pun; sama seperti / [0123456789] /.

5

/[a-z]/

Cocok dengan semua huruf kecil ASCII.

6

/[A-Z]/

Cocok dengan semua huruf ASCII huruf besar.

7

/[a-zA-Z0-9]/

Cocok dengan salah satu dari yang di atas.

8

/[^aeiou]/

Cocok dengan apa pun selain vokal huruf kecil.

9

/[^0-9]/

Mencocokkan apa pun selain digit.

Sr.No. Contoh & Deskripsi
1

/./

Cocok dengan karakter apa pun kecuali baris baru.

2

/./m

Dalam mode multi-baris, cocok juga dengan baris baru.

3

/\d/

Cocok dengan angka: / [0-9] /.

4

/\D/

Cocok dengan non-digit: / [^ 0-9] /.

5

/\s/

Cocok dengan karakter spasi: / [\ t \ r \ n \ f] /.

6

/\S/

Cocok dengan non-spasi: / [^ \ t \ r \ n \ f] /.

7

/\w/

Cocok dengan satu karakter kata: / [A-Za-z0-9 _] /.

8

/\W/

Cocok dengan karakter non-kata: / [^ A-Za-z0-9 _] /.

Sr.No. Contoh & Deskripsi
1

/ruby?/

Cocok dengan "gosok" atau "ruby": y adalah opsional.

2

/ruby*/

Cocok dengan "gosok" ditambah 0 atau lebih ys.

3

/ruby+/

Cocok "gosok" ditambah 1 atau lebih ys.

4

/\d{3}/

Cocok persis dengan 3 digit.

5

/\d{3,}/

Cocok dengan 3 digit atau lebih.

6

/\d{3,5}/

Cocok dengan 3, 4, atau 5 digit.

Ini cocok dengan jumlah pengulangan terkecil -

Sr.No. Contoh & Deskripsi
1

/<.*>/

Pengulangan serakah: cocok dengan "<ruby> perl>".

2

/<.*?>/

Tidak serakah: mencocokkan "<ruby>" dalam "<ruby> perl>".

Sr.No. Contoh & Deskripsi
1

/\D\d+/

Tidak ada grup: + berulang \ d

2

/(\D\d)+/

Dikelompokkan: + mengulangi \ D \ d pasangan

3

/([Rr]uby(, )?)+/

Cocokkan "Ruby", "Ruby, ruby, ruby", dll.

Ini cocok dengan grup yang sebelumnya cocok lagi -

Sr.No. Contoh & Deskripsi
1

/([Rr])uby&\1ails/

Cocok dengan ruby ​​& rails atau Ruby & Rails.

2

/(['"])(?:(?!\1).)*\1/

String kutip tunggal atau ganda. \ 1 cocok dengan apa pun yang cocok dengan grup pertama. \ 2 cocok dengan apapun yang cocok dengan grup ke-2, dll.

Sr.No. Contoh & Deskripsi
1

/ruby|rube/

Cocok dengan "ruby" atau "rube".

2

/rub(y|le))/

Cocok dengan "ruby" atau "ruble".

3

/ruby(!+|\?)/

"ruby" diikuti oleh satu atau lebih! atau satu?

Itu perlu menentukan posisi pertandingan.

Sr.No. Contoh & Deskripsi
1

/^Ruby/

Cocok dengan "Ruby" di awal string atau baris internal.

2

/Ruby$/

Cocok dengan "Ruby" di akhir string atau baris.

3

/\ARuby/

Cocok dengan "Ruby" di awal string.

4

/Ruby\Z/

Cocok dengan "Ruby" di akhir string.

5

/\bRuby\b/

Cocok dengan "Ruby" di batas kata.

6

/\brub\B/

\ B bukan batas kata: cocok dengan "gosok" dalam "rube" dan "ruby", tetapi tidak sendiri.

7

/Ruby(?=!)/

Cocok dengan "Ruby", jika diikuti dengan tanda seru.

8

/Ruby(?!!)/

Cocok dengan "Ruby", jika tidak diikuti dengan tanda seru.

Sr.No. Contoh & Deskripsi
1

/R(?#comment)/

Cocok dengan "R". Sisanya adalah komentar.

2

/R(?i)uby/

Tidak peka huruf besar / kecil saat mencocokkan "uby".

3

/R(?i:uby)/

Sama seperti di atas.

4

/rub(?:y|le))/

Kelompokkan hanya tanpa membuat \ 1 referensi latar.

Cari dan Ganti

Beberapa metode String terpenting yang menggunakan ekspresi reguler adalah sub dan gsub, dan variannya di tempat sub! dan gsub!.

Semua metode ini melakukan operasi cari-dan-ganti menggunakan pola Regexp. Itusub & sub! menggantikan kemunculan pertama pola dan gsub & gsub! menggantikan semua kejadian.

Itu sub dan gsub mengembalikan string baru, membiarkan string asli tidak diubah sebagai sub! dan gsub! memodifikasi string yang mereka panggil.

Berikut contohnya -

#!/usr/bin/ruby

phone = "2004-959-559 #This is Phone Number"

# Delete Ruby-style comments
phone = phone.sub!(/#.*$/, "")   
puts "Phone Num : #{phone}"

# Remove anything other than digits
phone = phone.gsub!(/\D/, "")    
puts "Phone Num : #{phone}"

Ini akan menghasilkan hasil sebagai berikut -

Phone Num : 2004-959-559
Phone Num : 2004959559

Berikut adalah contoh lain -

#!/usr/bin/ruby

text = "rails are rails, really good Ruby on Rails"

# Change "rails" to "Rails" throughout
text.gsub!("rails", "Rails")

# Capitalize the word "Rails" throughout
text.gsub!(/\brails\b/, "Rails")
puts "#{text}"

Ini akan menghasilkan hasil sebagai berikut -

Rails are Rails, really good Ruby on Rails