Python - Tìm kiếm bị ràng buộc
Nhiều lần, sau khi chúng tôi nhận được kết quả tìm kiếm, chúng tôi cần phải tìm kiếm sâu hơn một cấp độ trong một phần của kết quả tìm kiếm hiện có. Ví dụ: trong một nội dung văn bản nhất định, chúng tôi muốn lấy địa chỉ web và cũng trích xuất các phần khác nhau của địa chỉ web như giao thức, tên miền, v.v. Trong trường hợp đó, chúng tôi cần trợ giúp của hàm nhóm được sử dụng để phân chia kết quả tìm kiếm thành các nhóm khác nhau dựa trên biểu thức chính quy được chỉ định. Chúng tôi tạo biểu thức nhóm như vậy bằng cách tách kết quả tìm kiếm chính bằng cách sử dụng dấu ngoặc đơn xung quanh phần có thể tìm kiếm ngoại trừ các từ cố định mà chúng tôi muốn khớp.
import re
text = "The web address is https://www.tutorialspoint.com"
# Taking "://" and "." to separate the groups
result = re.search('([\w.-]+)://([\w.-]+)\.([\w.-]+)', text)
if result :
print "The main web Address: ",result.group()
print "The protocol: ",result.group(1)
print "The doman name: ",result.group(2)
print "The TLD: ",result.group(3)
Khi chúng tôi chạy chương trình trên, chúng tôi nhận được kết quả sau:
The main web Address: https://www.tutorialspoint.com
The protocol: https
The doman name: www.tutorialspoint
The TLD: com