Python - Einrichtung der Data Science-Umgebung
Um den Beispielcode in diesem Tutorial erfolgreich zu erstellen und auszuführen, benötigen wir eine Umgebung, die sowohl Allzweck-Python als auch die für Data Science erforderlichen Spezialpakete enthält. Wir werden zunächst die allgemeine Python-Installation installieren, bei der es sich um Python 2 oder Python 3 handeln kann. Für dieses Lernprogramm bevorzugen wir jedoch Python 2, hauptsächlich aufgrund seiner Reife und der breiteren Unterstützung externer Pakete.
Python bekommen
Der aktuellste und aktuellste Quellcode, Binärdateien, Dokumentationen, Nachrichten usw. sind auf der offiziellen Website von Python verfügbar https://www.python.org/
Sie können die Python-Dokumentation von herunterladen https://www.python.org/doc/. Die Dokumentation ist in den Formaten HTML, PDF und PostScript verfügbar.
Python installieren
Die Python-Distribution ist für eine Vielzahl von Plattformen verfügbar. Sie müssen nur den für Ihre Plattform geltenden Binärcode herunterladen und Python installieren.
Wenn der Binärcode für Ihre Plattform nicht verfügbar ist, benötigen Sie einen C-Compiler, um den Quellcode manuell zu kompilieren. Das Kompilieren des Quellcodes bietet mehr Flexibilität bei der Auswahl der Funktionen, die Sie für Ihre Installation benötigen.
Hier ist eine kurze Übersicht über die Installation von Python auf verschiedenen Plattformen -
Unix- und Linux-Installation
Hier sind die einfachen Schritte zum Installieren von Python auf einem Unix / Linux-Computer.
Öffnen Sie einen Webbrowser und gehen Sie zu https://www.python.org/downloads/.
Folgen Sie dem Link, um den für Unix / Linux verfügbaren komprimierten Quellcode herunterzuladen.
Dateien herunterladen und extrahieren.
Bearbeiten der Modul- / Setup- Datei, wenn Sie einige Optionen anpassen möchten.
Führen Sie das Skript ./configure aus
make
make install
Dadurch wird Python am Standardspeicherort / usr / local / bin und seine Bibliotheken unter / usr / local / lib / pythonXX installiert, wobei XX die Version von Python ist.
Windows-Installation
Hier sind die Schritte zum Installieren von Python auf einem Windows-Computer.
Öffnen Sie einen Webbrowser und gehen Sie zu https://www.python.org/downloads/.
Folgen Sie dem Link für die Windows-Installationsdatei python-XYZ.msi , wobei XYZ die Version ist, die Sie installieren müssen.
Um dieses Installationsprogramm python-XYZ.msi verwenden zu können , muss das Windows-System Microsoft Installer 2.0 unterstützen. Speichern Sie die Installationsdatei auf Ihrem lokalen Computer und führen Sie sie aus, um herauszufinden, ob Ihr Computer MSI unterstützt.
Führen Sie die heruntergeladene Datei aus. Dadurch wird der Python-Installationsassistent aufgerufen, der sehr einfach zu bedienen ist. Akzeptieren Sie einfach die Standardeinstellungen, warten Sie, bis die Installation abgeschlossen ist, und Sie sind fertig.
Macintosh-Installation
Auf neueren Macs ist Python installiert, es kann jedoch einige Jahre veraltet sein. Sehenhttp://www.python.org/download/mac/Anweisungen zum Abrufen der aktuellen Version sowie zusätzliche Tools zur Unterstützung der Entwicklung auf dem Mac. Für ältere Mac OS vor Mac OS X 10.3 (veröffentlicht 2003) ist MacPython verfügbar.
Jack Jansen pflegt es und Sie können auf seiner Website uneingeschränkt auf die gesamte Dokumentation zugreifen - http://www.cwi.nl/~jack/macpython.html. Hier finden Sie vollständige Installationsdetails für die Installation unter Mac OS.
PATH einrichten
Programme und andere ausführbare Dateien können sich in vielen Verzeichnissen befinden. Daher bieten Betriebssysteme einen Suchpfad, in dem die Verzeichnisse aufgelistet sind, in denen das Betriebssystem nach ausführbaren Dateien sucht.
Der Pfad wird in einer Umgebungsvariablen gespeichert, bei der es sich um eine benannte Zeichenfolge handelt, die vom Betriebssystem verwaltet wird. Diese Variable enthält Informationen, die der Befehlsshell und anderen Programmen zur Verfügung stehen.
Das path Die Variable wird unter Unix als PATH oder unter Windows als Path bezeichnet (bei Unix wird zwischen Groß- und Kleinschreibung unterschieden; Windows nicht).
Unter Mac OS übernimmt das Installationsprogramm die Pfaddetails. Um den Python-Interpreter von einem bestimmten Verzeichnis aus aufzurufen, müssen Sie das Python-Verzeichnis zu Ihrem Pfad hinzufügen.
Pfad unter Unix / Linux festlegen
So fügen Sie das Python-Verzeichnis dem Pfad für eine bestimmte Sitzung unter Unix hinzu:
In the csh shell - Geben Sie setenv PATH "$ PATH: / usr / local / bin / python" ein und drücken Sie die Eingabetaste.
In the bash shell (Linux) - Geben Sie export ATH = "$ PATH: / usr / local / bin / python" ein und drücken Sie die Eingabetaste.
In the sh or ksh shell - Geben Sie PATH = "$ PATH: / usr / local / bin / python" ein und drücken Sie die Eingabetaste.
Note - / usr / local / bin / python ist der Pfad des Python-Verzeichnisses
Pfad unter Windows einstellen
So fügen Sie das Python-Verzeichnis dem Pfad für eine bestimmte Sitzung in Windows hinzu:
At the command prompt - Geben Sie path% path%; C: \ Python ein und drücken Sie die Eingabetaste.
Note - C: \ Python ist der Pfad des Python-Verzeichnisses
Python-Umgebungsvariablen
Hier sind wichtige Umgebungsvariablen, die von Python erkannt werden können:
Sr.Nr. | Variable & Beschreibung |
---|---|
1 | PYTHONPATH Es hat eine ähnliche Rolle wie PATH. Diese Variable teilt dem Python-Interpreter mit, wo sich die in ein Programm importierten Moduldateien befinden sollen. Es sollte das Python-Quellbibliotheksverzeichnis und die Verzeichnisse enthalten, die Python-Quellcode enthalten. PYTHONPATH wird manchmal vom Python-Installationsprogramm voreingestellt. |
2 | PYTHONSTARTUP Es enthält den Pfad einer Initialisierungsdatei, die Python-Quellcode enthält. Es wird jedes Mal ausgeführt, wenn Sie den Interpreter starten. Es heißt unter Unix .pythonrc.py und enthält Befehle zum Laden von Dienstprogrammen oder zum Ändern von PYTHONPATH. |
3 | PYTHONCASEOK Es wird in Windows verwendet, um Python anzuweisen, die erste Übereinstimmung ohne Berücksichtigung der Groß- und Kleinschreibung in einer Importanweisung zu finden. Setzen Sie diese Variable auf einen beliebigen Wert, um sie zu aktivieren. |
4 | PYTHONHOME Es ist ein alternativer Modul-Suchpfad. Es ist normalerweise in die Verzeichnisse PYTHONSTARTUP oder PYTHONPATH eingebettet, um das Wechseln der Modulbibliotheken zu vereinfachen. |
Python ausführen
Es gibt drei verschiedene Möglichkeiten, Python zu starten:
Interaktiver Dolmetscher
Sie können Python unter Unix, DOS oder einem anderen System starten, das Ihnen einen Befehlszeileninterpreter oder ein Shell-Fenster bietet.
Eingeben python die Kommandozeile.
Starten Sie die Codierung sofort im interaktiven Interpreter.
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
Hier ist die Liste aller verfügbaren Befehlszeilenoptionen -
Sr.Nr. | Option & Beschreibung |
---|---|
1 | -d Es bietet Debug-Ausgabe. |
2 | -O Es generiert einen optimierten Bytecode (was zu .pyo-Dateien führt). |
3 | -S Führen Sie keine Importsite aus, um beim Start nach Python-Pfaden zu suchen. |
4 | -v ausführliche Ausgabe (detaillierte Ablaufverfolgung bei Importanweisungen). |
5 | -X Deaktivieren Sie klassenbasierte integrierte Ausnahmen (verwenden Sie einfach Zeichenfolgen). veraltet ab Version 1.6. |
6 | -c cmd Führen Sie das als cmd-Zeichenfolge gesendete Python-Skript aus |
7 | file Führen Sie das Python-Skript aus der angegebenen Datei aus |
Skript über die Befehlszeile
Ein Python-Skript kann über die Befehlszeile ausgeführt werden, indem der Interpreter in Ihrer Anwendung wie folgt aufgerufen wird:
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - Stellen Sie sicher, dass der Dateiberechtigungsmodus die Ausführung ermöglicht.
Integrierte Entwicklungsumgebung
Sie können Python auch in einer grafischen Benutzeroberfläche (GUI) ausführen, wenn auf Ihrem System eine GUI-Anwendung vorhanden ist, die Python unterstützt.
Unix - IDLE ist die allererste Unix-IDE für Python.
Windows - PythonWin ist die erste Windows-Oberfläche für Python und eine IDE mit einer GUI.
Macintosh - Die Macintosh-Version von Python ist zusammen mit der IDLE-IDE auf der Hauptwebsite verfügbar und kann entweder als MacBinary- oder BinHex-Datei heruntergeladen werden.
SciPy Pack installieren
Der beste Weg, um die erforderlichen Pakete zu aktivieren, besteht darin, ein installierbares Binärpaket zu verwenden, das für Ihr Betriebssystem spezifisch ist. Diese Binärdateien enthalten den vollständigen SciPy-Stack (einschließlich NumPy-, SciPy-, Matplotlib-, IPython-, SymPy- und Nose-Pakete sowie Kern-Python).
Windows
Anaconda (von www.continuum.io ) ist eine kostenlose Python-Distribution für den SciPy-Stack. Es ist auch für Linux und Mac verfügbar.
Canopy ( www.enthought.com/products/canopy/ ) ist sowohl als kostenlose als auch als kommerzielle Distribution mit vollständigem SciPy-Stack für Windows, Linux und Mac erhältlich.
Python (x, y): Es handelt sich um eine kostenlose Python-Distribution mit SciPy-Stack und Spyder IDE für Windows. (Herunterladbar von www.python-xy.github.io/ )
Linux
Paketmanager der jeweiligen Linux-Distributionen werden verwendet, um ein oder mehrere Pakete im SciPy-Stack zu installieren.
Für Ubuntu
sudo apt-get install python-numpy
python-scipy python-matplotlibipythonipythonnotebook python-pandas
python-sympy python-nose
Für Fedora
sudo yum install numpyscipy python-matplotlibipython
python-pandas sympy python-nose atlas-devel
Bauen aus der Quelle
Core Python (ab 2.6.x, 2.7.x und 3.2.x) muss mit distutils installiert werden und das zlib-Modul sollte aktiviert sein.
GNU gcc (4.2 und höher) C-Compiler muss verfügbar sein.
Führen Sie den folgenden Befehl aus, um NumPy zu installieren.
Python setup.py install
Lassen Sie uns testen, ob das NumPy-Modul ordnungsgemäß installiert ist, und versuchen, es von der Python-Eingabeaufforderung zu importieren.
Wenn es nicht installiert ist, wird die folgende Fehlermeldung angezeigt.
Traceback (most recent call last):
File "<pyshell#0>", line 1, in <module>
import numpy
ImportError: No module named 'numpy'
Ebenso können wir überprüfen, ob alle erforderlichen Data Science-Pakete installiert sind, die in den nächsten Kapiteln gezeigt werden.