Python - Membangun URL
Modul permintaan dapat membantu kita membangun URL dan memanipulasi nilai URL secara dinamis. Subdirektori mana pun dari URL dapat diambil secara terprogram dan kemudian beberapa bagiannya dapat diganti dengan nilai baru untuk membuat URL baru.
Build_URL
Contoh di bawah ini menggunakan urljoinuntuk mengambil subfolder yang berbeda di jalur URL. Metode urljoin digunakan untuk menambahkan nilai baru ke URL dasar.
from requests.compat import urljoin
base='https://stackoverflow.com/questions/3764291'
print urljoin(base,'.')
print urljoin(base,'..')
print urljoin(base,'...')
print urljoin(base,'/3764299/')
url_query = urljoin(base,'?vers=1.0')
print url_query
url_sec = urljoin(url_query,'#section-5.4')
print url_sec
Ketika kami menjalankan program di atas, kami mendapatkan output berikut -
https://stackoverflow.com/questions/
https://stackoverflow.com/
https://stackoverflow.com/questions/...
https://stackoverflow.com/3764299/
https://stackoverflow.com/questions/3764291?vers=1.0
https://stackoverflow.com/questions/3764291?vers=1.0#section-5.4
Pisahkan URL
URL juga dapat dibagi menjadi banyak bagian di luar alamat utama. Parameter tambahan yang digunakan untuk kueri atau tag tertentu yang dilampirkan ke URL dipisahkan dengan menggunakan metode urlparse seperti yang ditunjukkan di bawah ini.
from requests.compat import urlparse
url1 = 'https://docs.python.org/2/py-modindex.html#cap-f'
url2='https://docs.python.org/2/search.html?q=urlparse'
print urlparse(url1)
print urlparse(url2)
Ketika kami menjalankan program di atas, kami mendapatkan output berikut -
ParseResult(scheme='https', netloc='docs.python.org', path='/2/py-modindex.html', params='', query='', fragment='cap-f')
ParseResult(scheme='https', netloc='docs.python.org', path='/2/search.html', params='', query='q=urlparse', fragment='')