Erste Schritte mit Python

Im ersten Kapitel haben wir gelernt, worum es beim Web Scraping geht. In diesem Kapitel erfahren Sie, wie Sie Web Scraping mit Python implementieren.

Warum Python für Web Scraping?

Python ist ein beliebtes Tool zum Implementieren von Web Scraping. Die Programmiersprache Python wird auch für andere nützliche Projekte im Zusammenhang mit Cybersicherheit, Penetrationstests sowie digitalen forensischen Anwendungen verwendet. Mit der Basisprogrammierung von Python kann Web Scraping ohne Verwendung eines anderen Tools von Drittanbietern durchgeführt werden.

Die Programmiersprache Python wird immer beliebter und die Gründe, warum Python für Web-Scraping-Projekte gut geeignet ist, sind folgende:

Syntax Einfachheit

Python hat im Vergleich zu anderen Programmiersprachen die einfachste Struktur. Diese Funktion von Python erleichtert das Testen und ein Entwickler kann sich mehr auf die Programmierung konzentrieren.

Eingebaute Module

Ein weiterer Grund für die Verwendung von Python für das Web-Scraping sind die eingebauten und externen nützlichen Bibliotheken. Wir können viele Implementierungen im Zusammenhang mit Web Scraping durchführen, indem wir Python als Basis für die Programmierung verwenden.

Open Source Programmiersprache

Python hat große Unterstützung von der Community, da es eine Open-Source-Programmiersprache ist.

Breites Anwendungsspektrum

Python kann für verschiedene Programmieraufgaben verwendet werden, die von kleinen Shell-Skripten bis hin zu Webanwendungen für Unternehmen reichen.

Installation von Python

Die Python-Distribution ist für Plattformen wie Windows, MAC und Unix / Linux verfügbar. Wir müssen nur den Binärcode herunterladen, der für unsere Plattform zur Installation von Python gilt. Falls der Binärcode für unsere Plattform jedoch nicht verfügbar ist, benötigen wir einen C-Compiler, damit der Quellcode manuell kompiliert werden kann.

Wir können Python wie folgt auf verschiedenen Plattformen installieren:

Python unter Unix und Linux installieren

Sie müssen die folgenden Schritte ausführen, um Python auf Unix / Linux-Computern zu installieren.

Step 1 - Gehen Sie zum Link https://www.python.org/downloads/

Step 2 - Laden Sie den für Unix / Linux verfügbaren komprimierten Quellcode über den obigen Link herunter.

Step 3 - Extrahieren Sie die Dateien auf Ihren Computer.

Step 4 - Verwenden Sie die folgenden Befehle, um die Installation abzuschließen. -

run ./configure script
make
make install

Sie finden installiertes Python am Standardspeicherort /usr/local/bin und seine Bibliotheken bei /usr/local/lib/pythonXX, wobei XX die Version von Python ist.

Python unter Windows installieren

Sie müssen die folgenden Schritte ausführen, um Python auf Windows-Computern zu installieren:

Step 1 - Gehen Sie zum Link https://www.python.org/downloads/

Step 2 - Laden Sie das Windows-Installationsprogramm herunter python-XYZ.msi Datei, wobei XYZ die Version ist, die wir installieren müssen.

Step 3 - Speichern Sie nun die Installationsdatei auf Ihrem lokalen Computer und führen Sie die MSI-Datei aus.

Step 4 - Führen Sie zuletzt die heruntergeladene Datei aus, um den Python-Installationsassistenten aufzurufen.

Python auf Macintosh installieren

Wir müssen verwenden Homebrew für die Installation von Python 3 unter Mac OS X. Homebrew ist einfach zu installieren und ein großartiges Paketinstallationsprogramm.

Homebrew kann auch mit dem folgenden Befehl installiert werden:

$ ruby -e "$(curl -fsSL
https://raw.githubusercontent.com/Homebrew/install/master/install)"

Zum Aktualisieren des Paketmanagers können wir den folgenden Befehl verwenden:

$ brew update

Mit Hilfe des folgenden Befehls können wir Python3 auf unserem MAC-Computer installieren -

$ brew install python3

Einrichten des Pfads

Mit den folgenden Anweisungen können Sie den Pfad in verschiedenen Umgebungen einrichten:

Einrichten des Pfads unter Unix / Linux

Verwenden Sie die folgenden Befehle, um Pfade mit verschiedenen Befehls-Shells einzurichten:

Für csh Shell

setenv PATH "$PATH:/usr/local/bin/python".

Für Bash Shell (Linux)

ATH="$PATH:/usr/local/bin/python".

Für sh oder ksh Shell

PATH="$PATH:/usr/local/bin/python".

Einrichten des Pfads unter Windows

Zum Festlegen des Pfads unter Windows können wir den Pfad verwenden %path%;C:\Python an der Eingabeaufforderung und drücken Sie die Eingabetaste.

Python ausführen

Wir können Python auf eine der folgenden drei Arten starten:

Interaktiver Dolmetscher

Zum Starten von Python kann ein Betriebssystem wie UNIX und DOS verwendet werden, das einen Befehlszeileninterpreter oder eine Shell bereitstellt.

Wir können mit der Codierung im interaktiven Interpreter wie folgt beginnen:

Step 1 - Geben Sie ein python an der Kommandozeile.

Step 2 - Dann können wir sofort mit dem Codieren im interaktiven Interpreter beginnen.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Skript über die Befehlszeile

Wir können ein Python-Skript in der Befehlszeile ausführen, indem wir den Interpreter aufrufen. Es kann wie folgt verstanden werden:

$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS

Integrierte Entwicklungsumgebung

Wir können Python auch in einer GUI-Umgebung ausführen, wenn das System über eine GUI-Anwendung verfügt, die Python unterstützt. Einige IDEs, die Python auf verschiedenen Plattformen unterstützen, sind unten aufgeführt:

IDE for UNIX - UNIX für Python hat IDLE IDE.

IDE for Windows - Windows hat PythonWin IDE, die auch GUI hat.

IDE for Macintosh - Macintosh verfügt über eine IDLE-IDE, die entweder als MacBinary- oder BinHex-Datei von der Hauptwebsite heruntergeladen werden kann.