Python - Trích xuất email từ văn bản
Để trích xuất văn bản của mẫu email, chúng ta có thể sử dụng biểu thức chính quy. Trong ví dụ dưới đây, chúng tôi sử dụng gói biểu thức chính quy để xác định mẫu của một ID email và sau đó sử dụngfindall() chức năng để truy xuất những văn bản phù hợp với mẫu này.
import re
text = "Please contact us at [email protected] for further information."+\
" You can also give feedbacl at [email protected]"
emails = re.findall(r"[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+", text)
print emails
Khi chúng tôi chạy chương trình trên, chúng tôi nhận được kết quả sau:
['[email protected]', '[email protected]']