पायथन - बिल्डिंग यूआरएल
अनुरोध मॉड्यूल हमें URLS बनाने में मदद कर सकते हैं और URL मान को गतिशील रूप से जोड़ सकते हैं। URL की किसी भी उप-निर्देशिका को प्रोग्रामेटिक रूप से प्राप्त किया जा सकता है और फिर इसके कुछ भाग को नए URL बनाने के लिए नए मूल्यों के साथ प्रतिस्थापित किया जा सकता है।
Build_URL
नीचे दिए गए उदाहरण का उपयोग करता है urljoinURL पथ में विभिन्न सबफ़ोल्डर्स लाने के लिए। बेस URL में नए मान जोड़ने के लिए urljoin विधि का उपयोग किया जाता है।
from requests.compat import urljoin
base='https://stackoverflow.com/questions/3764291'
print urljoin(base,'.')
print urljoin(base,'..')
print urljoin(base,'...')
print urljoin(base,'/3764299/')
url_query = urljoin(base,'?vers=1.0')
print url_query
url_sec = urljoin(url_query,'#section-5.4')
print url_sec
जब हम उपरोक्त कार्यक्रम चलाते हैं, तो हमें निम्नलिखित आउटपुट मिलते हैं -
https://stackoverflow.com/questions/
https://stackoverflow.com/
https://stackoverflow.com/questions/...
https://stackoverflow.com/3764299/
https://stackoverflow.com/questions/3764291?vers=1.0
https://stackoverflow.com/questions/3764291?vers=1.0#section-5.4
URLS को विभाजित करें
URL को मुख्य पते से परे कई हिस्सों में विभाजित किया जा सकता है। अतिरिक्त पैरामीटर जो URL से जुड़े किसी विशिष्ट क्वेरी या टैग के लिए उपयोग किए जाते हैं, उन्हें नीचे दिखाए अनुसार urlparse विधि का उपयोग करके अलग किया जाता है।
from requests.compat import urlparse
url1 = 'https://docs.python.org/2/py-modindex.html#cap-f'
url2='https://docs.python.org/2/search.html?q=urlparse'
print urlparse(url1)
print urlparse(url2)
जब हम उपरोक्त कार्यक्रम चलाते हैं, तो हमें निम्नलिखित आउटपुट मिलते हैं -
ParseResult(scheme='https', netloc='docs.python.org', path='/2/py-modindex.html', params='', query='', fragment='cap-f')
ParseResult(scheme='https', netloc='docs.python.org', path='/2/search.html', params='', query='q=urlparse', fragment='')