Python - Einrichtung der Data Science-Umgebung

Um den Beispielcode in diesem Tutorial erfolgreich zu erstellen und auszuführen, benötigen wir eine Umgebung, die sowohl Allzweck-Python als auch die für Data Science erforderlichen Spezialpakete enthält. Wir werden zunächst die allgemeine Python-Installation installieren, bei der es sich um Python 2 oder Python 3 handeln kann. Für dieses Lernprogramm bevorzugen wir jedoch Python 2, hauptsächlich aufgrund seiner Reife und der breiteren Unterstützung externer Pakete.

Python bekommen

Der aktuellste und aktuellste Quellcode, Binärdateien, Dokumentationen, Nachrichten usw. sind auf der offiziellen Website von Python verfügbar https://www.python.org/

Sie können die Python-Dokumentation von herunterladen https://www.python.org/doc/. Die Dokumentation ist in den Formaten HTML, PDF und PostScript verfügbar.

Python installieren

Die Python-Distribution ist für eine Vielzahl von Plattformen verfügbar. Sie müssen nur den für Ihre Plattform geltenden Binärcode herunterladen und Python installieren.

Wenn der Binärcode für Ihre Plattform nicht verfügbar ist, benötigen Sie einen C-Compiler, um den Quellcode manuell zu kompilieren. Das Kompilieren des Quellcodes bietet mehr Flexibilität bei der Auswahl der Funktionen, die Sie für Ihre Installation benötigen.

Hier ist eine kurze Übersicht über die Installation von Python auf verschiedenen Plattformen -

Unix- und Linux-Installation

Hier sind die einfachen Schritte zum Installieren von Python auf einem Unix / Linux-Computer.

  • Öffnen Sie einen Webbrowser und gehen Sie zu https://www.python.org/downloads/.

  • Folgen Sie dem Link, um den für Unix / Linux verfügbaren komprimierten Quellcode herunterzuladen.

  • Dateien herunterladen und extrahieren.

  • Bearbeiten der Modul- / Setup- Datei, wenn Sie einige Optionen anpassen möchten.

  • Führen Sie das Skript ./configure aus

  • make

  • make install

Dadurch wird Python am Standardspeicherort / usr / local / bin und seine Bibliotheken unter / usr / local / lib / pythonXX installiert, wobei XX die Version von Python ist.

Windows-Installation

Hier sind die Schritte zum Installieren von Python auf einem Windows-Computer.

  • Öffnen Sie einen Webbrowser und gehen Sie zu https://www.python.org/downloads/.

  • Folgen Sie dem Link für die Windows-Installationsdatei python-XYZ.msi , wobei XYZ die Version ist, die Sie installieren müssen.

  • Um dieses Installationsprogramm python-XYZ.msi verwenden zu können , muss das Windows-System Microsoft Installer 2.0 unterstützen. Speichern Sie die Installationsdatei auf Ihrem lokalen Computer und führen Sie sie aus, um herauszufinden, ob Ihr Computer MSI unterstützt.

  • Führen Sie die heruntergeladene Datei aus. Dadurch wird der Python-Installationsassistent aufgerufen, der sehr einfach zu bedienen ist. Akzeptieren Sie einfach die Standardeinstellungen, warten Sie, bis die Installation abgeschlossen ist, und Sie sind fertig.

Macintosh-Installation

Auf neueren Macs ist Python installiert, es kann jedoch einige Jahre veraltet sein. Sehenhttp://www.python.org/download/mac/Anweisungen zum Abrufen der aktuellen Version sowie zusätzliche Tools zur Unterstützung der Entwicklung auf dem Mac. Für ältere Mac OS vor Mac OS X 10.3 (veröffentlicht 2003) ist MacPython verfügbar.

Jack Jansen pflegt es und Sie können auf seiner Website uneingeschränkt auf die gesamte Dokumentation zugreifen - http://www.cwi.nl/~jack/macpython.html. Hier finden Sie vollständige Installationsdetails für die Installation unter Mac OS.

PATH einrichten

Programme und andere ausführbare Dateien können sich in vielen Verzeichnissen befinden. Daher bieten Betriebssysteme einen Suchpfad, in dem die Verzeichnisse aufgelistet sind, in denen das Betriebssystem nach ausführbaren Dateien sucht.

Der Pfad wird in einer Umgebungsvariablen gespeichert, bei der es sich um eine benannte Zeichenfolge handelt, die vom Betriebssystem verwaltet wird. Diese Variable enthält Informationen, die der Befehlsshell und anderen Programmen zur Verfügung stehen.

Das path Die Variable wird unter Unix als PATH oder unter Windows als Path bezeichnet (bei Unix wird zwischen Groß- und Kleinschreibung unterschieden; Windows nicht).

Unter Mac OS übernimmt das Installationsprogramm die Pfaddetails. Um den Python-Interpreter von einem bestimmten Verzeichnis aus aufzurufen, müssen Sie das Python-Verzeichnis zu Ihrem Pfad hinzufügen.

Pfad unter Unix / Linux festlegen

So fügen Sie das Python-Verzeichnis dem Pfad für eine bestimmte Sitzung unter Unix hinzu:

  • In the csh shell - Geben Sie setenv PATH "$ PATH: / usr / local / bin / python" ein und drücken Sie die Eingabetaste.

  • In the bash shell (Linux) - Geben Sie export ATH = "$ PATH: / usr / local / bin / python" ein und drücken Sie die Eingabetaste.

  • In the sh or ksh shell - Geben Sie PATH = "$ PATH: / usr / local / bin / python" ein und drücken Sie die Eingabetaste.

  • Note - / usr / local / bin / python ist der Pfad des Python-Verzeichnisses

Pfad unter Windows einstellen

So fügen Sie das Python-Verzeichnis dem Pfad für eine bestimmte Sitzung in Windows hinzu:

At the command prompt - Geben Sie path% path%; C: \ Python ein und drücken Sie die Eingabetaste.

Note - C: \ Python ist der Pfad des Python-Verzeichnisses

Python-Umgebungsvariablen

Hier sind wichtige Umgebungsvariablen, die von Python erkannt werden können:

Sr.Nr. Variable & Beschreibung
1

PYTHONPATH

Es hat eine ähnliche Rolle wie PATH. Diese Variable teilt dem Python-Interpreter mit, wo sich die in ein Programm importierten Moduldateien befinden sollen. Es sollte das Python-Quellbibliotheksverzeichnis und die Verzeichnisse enthalten, die Python-Quellcode enthalten. PYTHONPATH wird manchmal vom Python-Installationsprogramm voreingestellt.

2

PYTHONSTARTUP

Es enthält den Pfad einer Initialisierungsdatei, die Python-Quellcode enthält. Es wird jedes Mal ausgeführt, wenn Sie den Interpreter starten. Es heißt unter Unix .pythonrc.py und enthält Befehle zum Laden von Dienstprogrammen oder zum Ändern von PYTHONPATH.

3

PYTHONCASEOK

Es wird in Windows verwendet, um Python anzuweisen, die erste Übereinstimmung ohne Berücksichtigung der Groß- und Kleinschreibung in einer Importanweisung zu finden. Setzen Sie diese Variable auf einen beliebigen Wert, um sie zu aktivieren.

4

PYTHONHOME

Es ist ein alternativer Modul-Suchpfad. Es ist normalerweise in die Verzeichnisse PYTHONSTARTUP oder PYTHONPATH eingebettet, um das Wechseln der Modulbibliotheken zu vereinfachen.

Python ausführen

Es gibt drei verschiedene Möglichkeiten, Python zu starten:

Interaktiver Dolmetscher

Sie können Python unter Unix, DOS oder einem anderen System starten, das Ihnen einen Befehlszeileninterpreter oder ein Shell-Fenster bietet.

Eingeben python die Kommandozeile.

Starten Sie die Codierung sofort im interaktiven Interpreter.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Hier ist die Liste aller verfügbaren Befehlszeilenoptionen -

Sr.Nr. Option & Beschreibung
1

-d

Es bietet Debug-Ausgabe.

2

-O

Es generiert einen optimierten Bytecode (was zu .pyo-Dateien führt).

3

-S

Führen Sie keine Importsite aus, um beim Start nach Python-Pfaden zu suchen.

4

-v

ausführliche Ausgabe (detaillierte Ablaufverfolgung bei Importanweisungen).

5

-X

Deaktivieren Sie klassenbasierte integrierte Ausnahmen (verwenden Sie einfach Zeichenfolgen). veraltet ab Version 1.6.

6

-c cmd

Führen Sie das als cmd-Zeichenfolge gesendete Python-Skript aus

7

file

Führen Sie das Python-Skript aus der angegebenen Datei aus

Skript über die Befehlszeile

Ein Python-Skript kann über die Befehlszeile ausgeführt werden, indem der Interpreter in Ihrer Anwendung wie folgt aufgerufen wird:

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

Note - Stellen Sie sicher, dass der Dateiberechtigungsmodus die Ausführung ermöglicht.

Integrierte Entwicklungsumgebung

Sie können Python auch in einer grafischen Benutzeroberfläche (GUI) ausführen, wenn auf Ihrem System eine GUI-Anwendung vorhanden ist, die Python unterstützt.

  • Unix - IDLE ist die allererste Unix-IDE für Python.

  • Windows - PythonWin ist die erste Windows-Oberfläche für Python und eine IDE mit einer GUI.

  • Macintosh - Die Macintosh-Version von Python ist zusammen mit der IDLE-IDE auf der Hauptwebsite verfügbar und kann entweder als MacBinary- oder BinHex-Datei heruntergeladen werden.

SciPy Pack installieren

Der beste Weg, um die erforderlichen Pakete zu aktivieren, besteht darin, ein installierbares Binärpaket zu verwenden, das für Ihr Betriebssystem spezifisch ist. Diese Binärdateien enthalten den vollständigen SciPy-Stack (einschließlich NumPy-, SciPy-, Matplotlib-, IPython-, SymPy- und Nose-Pakete sowie Kern-Python).

Windows

Anaconda (von www.continuum.io ) ist eine kostenlose Python-Distribution für den SciPy-Stack. Es ist auch für Linux und Mac verfügbar.

Canopy ( www.enthought.com/products/canopy/ ) ist sowohl als kostenlose als auch als kommerzielle Distribution mit vollständigem SciPy-Stack für Windows, Linux und Mac erhältlich.

Python (x, y): Es handelt sich um eine kostenlose Python-Distribution mit SciPy-Stack und Spyder IDE für Windows. (Herunterladbar von www.python-xy.github.io/ )

Linux

Paketmanager der jeweiligen Linux-Distributionen werden verwendet, um ein oder mehrere Pakete im SciPy-Stack zu installieren.

Für Ubuntu

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

Für Fedora

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

Bauen aus der Quelle

Core Python (ab 2.6.x, 2.7.x und 3.2.x) muss mit distutils installiert werden und das zlib-Modul sollte aktiviert sein.

GNU gcc (4.2 und höher) C-Compiler muss verfügbar sein.

Führen Sie den folgenden Befehl aus, um NumPy zu installieren.

Python setup.py install

Lassen Sie uns testen, ob das NumPy-Modul ordnungsgemäß installiert ist, und versuchen, es von der Python-Eingabeaufforderung zu importieren.

Wenn es nicht installiert ist, wird die folgende Fehlermeldung angezeigt.

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

Ebenso können wir überprüfen, ob alle erforderlichen Data Science-Pakete installiert sind, die in den nächsten Kapiteln gezeigt werden.