Python - URLs erstellen
Das Anforderungsmodul kann uns helfen, die URLs zu erstellen und den URL-Wert dynamisch zu bearbeiten. Jedes Unterverzeichnis der URL kann programmgesteuert abgerufen und ein Teil davon durch neue Werte ersetzt werden, um neue URLs zu erstellen.
Build_URL
Das folgende Beispiel verwendet urljoinum die verschiedenen Unterordner im URL-Pfad abzurufen. Die urljoin-Methode wird verwendet, um der Basis-URL neue Werte hinzuzufügen.
from requests.compat import urljoin
base='https://stackoverflow.com/questions/3764291'
print urljoin(base,'.')
print urljoin(base,'..')
print urljoin(base,'...')
print urljoin(base,'/3764299/')
url_query = urljoin(base,'?vers=1.0')
print url_query
url_sec = urljoin(url_query,'#section-5.4')
print url_sec
Wenn wir das obige Programm ausführen, erhalten wir die folgende Ausgabe:
https://stackoverflow.com/questions/
https://stackoverflow.com/
https://stackoverflow.com/questions/...
https://stackoverflow.com/3764299/
https://stackoverflow.com/questions/3764291?vers=1.0
https://stackoverflow.com/questions/3764291?vers=1.0#section-5.4
Teilen Sie die URLs
Die URLs können auch über die Hauptadresse hinaus in viele Teile aufgeteilt werden. Die zusätzlichen Parameter, die für eine bestimmte Abfrage oder Tags verwendet werden, die an die URL angehängt sind, werden mithilfe der unten gezeigten urlparse-Methode getrennt.
from requests.compat import urlparse
url1 = 'https://docs.python.org/2/py-modindex.html#cap-f'
url2='https://docs.python.org/2/search.html?q=urlparse'
print urlparse(url1)
print urlparse(url2)
Wenn wir das obige Programm ausführen, erhalten wir die folgende Ausgabe:
ParseResult(scheme='https', netloc='docs.python.org', path='/2/py-modindex.html', params='', query='', fragment='cap-f')
ParseResult(scheme='https', netloc='docs.python.org', path='/2/search.html', params='', query='q=urlparse', fragment='')