Python - Xây dựng URL
Mô-đun yêu cầu có thể giúp chúng tôi tạo URL và thao tác động giá trị URL. Bất kỳ thư mục con nào của URL đều có thể được tìm nạp theo chương trình và sau đó một số phần của nó có thể được thay thế bằng các giá trị mới để tạo URL mới.
Build_URL
Ví dụ dưới đây sử dụng urljoinđể tìm nạp các thư mục con khác nhau trong đường dẫn URL. Phương thức urljoin được sử dụng để thêm các giá trị mới vào URL cơ sở.
from requests.compat import urljoin
base='https://stackoverflow.com/questions/3764291'
print urljoin(base,'.')
print urljoin(base,'..')
print urljoin(base,'...')
print urljoin(base,'/3764299/')
url_query = urljoin(base,'?vers=1.0')
print url_query
url_sec = urljoin(url_query,'#section-5.4')
print url_sec
Khi chúng tôi chạy chương trình trên, chúng tôi nhận được kết quả sau:
https://stackoverflow.com/questions/
https://stackoverflow.com/
https://stackoverflow.com/questions/...
https://stackoverflow.com/3764299/
https://stackoverflow.com/questions/3764291?vers=1.0
https://stackoverflow.com/questions/3764291?vers=1.0#section-5.4
Tách các URL
Các URL cũng có thể được chia thành nhiều phần ngoài địa chỉ chính. Các tham số bổ sung được sử dụng cho một truy vấn cụ thể hoặc các thẻ gắn với URL được phân tách bằng cách sử dụng phương thức urlparse như được hiển thị bên dưới.
from requests.compat import urlparse
url1 = 'https://docs.python.org/2/py-modindex.html#cap-f'
url2='https://docs.python.org/2/search.html?q=urlparse'
print urlparse(url1)
print urlparse(url2)
Khi chúng tôi chạy chương trình trên, chúng tôi nhận được kết quả sau:
ParseResult(scheme='https', netloc='docs.python.org', path='/2/py-modindex.html', params='', query='', fragment='cap-f')
ParseResult(scheme='https', netloc='docs.python.org', path='/2/search.html', params='', query='q=urlparse', fragment='')