Python - konfiguracja środowiska nauki o danych

Aby pomyślnie utworzyć i uruchomić przykładowy kod w tym samouczku, będziemy potrzebować skonfigurowanego środowiska, które będzie zawierało zarówno język Python ogólnego przeznaczenia, jak i specjalne pakiety wymagane do nauki o danych. Najpierw przyjrzymy się instalacji Pythona ogólnego przeznaczenia, którym może być python 2 lub python 3. Jednak w tym samouczku będziemy preferować Pythona 2, głównie ze względu na jego dojrzałość i szerszą obsługę pakietów zewnętrznych.

Pobieranie Pythona

Najbardziej aktualny i aktualny kod źródłowy, pliki binarne, dokumentacja, aktualności itp. Są dostępne na oficjalnej stronie Pythona https://www.python.org/

Możesz pobrać dokumentację Pythona z https://www.python.org/doc/. Dokumentacja jest dostępna w formatach HTML, PDF i PostScript.

Instalowanie Pythona

Dystrybucja Pythona jest dostępna na wiele różnych platform. Musisz pobrać tylko kod binarny odpowiedni dla Twojej platformy i zainstalować Python.

Jeśli kod binarny dla Twojej platformy nie jest dostępny, potrzebujesz kompilatora C do ręcznej kompilacji kodu źródłowego. Kompilowanie kodu źródłowego zapewnia większą elastyczność pod względem wyboru funkcji wymaganych w instalacji.

Oto krótki przegląd instalacji Pythona na różnych platformach -

Instalacja w systemach Unix i Linux

Oto proste kroki instalacji Pythona na komputerze z systemem Unix / Linux.

  • Otwórz przeglądarkę internetową i przejdź do https://www.python.org/downloads/.

  • Kliknij łącze, aby pobrać spakowany kod źródłowy dostępny dla systemów Unix / Linux.

  • Pobierz i rozpakuj pliki.

  • Edycja pliku modułów / ustawień , jeśli chcesz dostosować niektóre opcje.

  • uruchom skrypt ./configure

  • make

  • dokonać instalacji

Spowoduje to zainstalowanie Pythona w standardowej lokalizacji / usr / local / bin i jego bibliotek w / usr / local / lib / pythonXX, gdzie XX to wersja Pythona.

Instalacja systemu Windows

Oto kroki instalacji Pythona na komputerze z systemem Windows.

  • Otwórz przeglądarkę internetową i przejdź do https://www.python.org/downloads/.

  • Skorzystaj z łącza do pliku instalatora Windows python-XYZ.msi , gdzie XYZ to wersja, którą musisz zainstalować.

  • Aby użyć tego instalatora python-XYZ.msi , system Windows musi obsługiwać Microsoft Installer 2.0. Zapisz plik instalatora na komputerze lokalnym, a następnie uruchom go, aby sprawdzić, czy Twój komputer obsługuje MSI.

  • Uruchom pobrany plik. Spowoduje to wyświetlenie kreatora instalacji języka Python, który jest naprawdę łatwy w użyciu. Po prostu zaakceptuj ustawienia domyślne, poczekaj, aż instalacja zostanie zakończona i gotowe.

Instalacja na komputerze Macintosh

Najnowsze komputery Mac są dostarczane z zainstalowanym językiem Python, ale może on być kilka lat nieaktualny. Widziećhttp://www.python.org/download/mac/aby uzyskać instrukcje dotyczące uzyskiwania aktualnej wersji wraz z dodatkowymi narzędziami do obsługi programowania na komputerze Mac. W przypadku starszych systemów Mac OS wcześniejszych niż Mac OS X 10.3 (wydany w 2003 r.) Dostępny jest MacPython.

Utrzymuje go Jack Jansen, a do całej dokumentacji można mieć pełny dostęp na jego stronie internetowej - http://www.cwi.nl/~jack/macpython.html. Możesz znaleźć pełne szczegóły dotyczące instalacji systemu Mac OS.

Konfigurowanie PATH

Programy i inne pliki wykonywalne mogą znajdować się w wielu katalogach, więc systemy operacyjne zapewniają ścieżkę wyszukiwania zawierającą listę katalogów przeszukiwanych przez system operacyjny w poszukiwaniu plików wykonywalnych.

Ścieżka jest przechowywana w zmiennej środowiskowej, która jest nazwanym ciągiem obsługiwanym przez system operacyjny. Ta zmienna zawiera informacje dostępne dla powłoki poleceń i innych programów.

Plik path zmienna nosi nazwę PATH w systemie Unix lub Path w systemie Windows (w systemie Unix rozróżniana jest wielkość liter; w systemie Windows nie).

W systemie Mac OS instalator obsługuje szczegóły ścieżki. Aby wywołać interpreter języka Python z dowolnego katalogu, musisz dodać katalog Python do swojej ścieżki.

Ustawianie ścieżki w Unix / Linux

Aby dodać katalog Pythona do ścieżki dla określonej sesji w systemie Unix -

  • In the csh shell - wpisz setenv PATH "$ PATH: / usr / local / bin / python" i naciśnij Enter.

  • In the bash shell (Linux) - wpisz export ATH = "$ PATH: / usr / local / bin / python" i naciśnij Enter.

  • In the sh or ksh shell - wpisz PATH = "$ PATH: / usr / local / bin / python" i naciśnij Enter.

  • Note - / usr / local / bin / python to ścieżka do katalogu Pythona

Ustawianie ścieżki w systemie Windows

Aby dodać katalog Python do ścieżki dla określonej sesji w systemie Windows -

At the command prompt - wpisz path% path%; C: \ Python i naciśnij Enter.

Note - C: \ Python to ścieżka do katalogu Pythona

Zmienne środowiskowe Pythona

Oto ważne zmienne środowiskowe, które można rozpoznać w Pythonie -

Sr.No. Zmienna i opis
1

PYTHONPATH

Pełni rolę podobną do PATH. Ta zmienna informuje interpreter języka Python, gdzie ma znaleźć pliki modułów zaimportowane do programu. Powinien zawierać katalog biblioteki źródłowej Pythona i katalogi zawierające kod źródłowy Pythona. PYTHONPATH jest czasami wstępnie ustawiana przez instalator Pythona.

2

PYTHONSTARTUP

Zawiera ścieżkę do pliku inicjalizacyjnego zawierającego kod źródłowy Pythona. Jest wykonywany za każdym razem, gdy uruchamiasz tłumacza. Nazywa się .pythonrc.py w systemie Unix i zawiera polecenia, które ładują narzędzia lub modyfikują PYTHONPATH.

3

PYTHONCASEOK

Jest używany w systemie Windows do instruowania Pythona, aby znalazł pierwsze dopasowanie bez uwzględniania wielkości liter w instrukcji importu. Ustaw tę zmienną na dowolną wartość, aby ją aktywować.

4

PYTHONHOME

Jest to alternatywna ścieżka wyszukiwania modułu. Zwykle jest osadzony w katalogach PYTHONSTARTUP lub PYTHONPATH, aby ułatwić przełączanie bibliotek modułów.

Uruchamianie Pythona

Istnieją trzy różne sposoby uruchomienia Pythona -

Interaktywny tłumacz

Możesz uruchomić Pythona z systemu Unix, DOS lub dowolnego innego systemu, który udostępnia interpreter wiersza poleceń lub okno powłoki.

Wchodzić python wiersz poleceń.

Rozpocznij kodowanie od razu w interaktywnym tłumaczu.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Oto lista wszystkich dostępnych opcji wiersza poleceń -

Sr.No. Opcja i opis
1

-d

Zapewnia wyjście debugowania.

2

-O

Generuje zoptymalizowany kod bajtowy (w wyniku czego powstają pliki .pyo).

3

-S

Nie uruchamiaj witryny importu w celu wyszukania ścieżek Pythona podczas uruchamiania.

4

-v

szczegółowe dane wyjściowe (szczegółowe śledzenie instrukcji importu).

5

-X

wyłącz wbudowane wyjątki oparte na klasach (użyj po prostu ciągów znaków); przestarzałe począwszy od wersji 1.6.

6

-c cmd

uruchom skrypt Pythona wysłany jako ciąg cmd

7

file

uruchom skrypt Pythona z podanego pliku

Skrypt z wiersza poleceń

Skrypt Pythona można wykonać w wierszu poleceń, wywołując interpreter w aplikacji, jak w poniższym przykładzie -

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

Note - Upewnij się, że tryb uprawnień do plików umożliwia wykonanie.

Zintegrowane środowisko programistyczne

Możesz również uruchomić Python ze środowiska graficznego interfejsu użytkownika (GUI), jeśli masz aplikację GUI w systemie, która obsługuje język Python.

  • Unix - IDLE jest pierwszym IDE Uniksa dla Pythona.

  • Windows - PythonWin jest pierwszym interfejsem Windows dla Pythona i jest IDE z GUI.

  • Macintosh - Wersja Pythona dla komputerów Macintosh wraz z IDLE IDE jest dostępna z głównej strony internetowej, do pobrania jako pliki MacBinary lub BinHex'd.

Instalowanie pakietu SciPy

Najlepszym sposobem włączenia wymaganych pakietów jest użycie instalowalnego pakietu binarnego odpowiedniego dla Twojego systemu operacyjnego. Te pliki binarne zawierają pełny stos SciPy (w tym pakiety NumPy, SciPy, matplotlib, IPython, SymPy i nos wraz z podstawowym językiem Python).

Windows

Anaconda (z www.continuum.io ) to darmowa dystrybucja Pythona dla stosu SciPy. Jest również dostępny dla systemów Linux i Mac.

Canopy ( www.enthought.com/products/canopy/ ) jest dostępna jako bezpłatna i komercyjna dystrybucja z pełnym stosem SciPy dla systemów Windows, Linux i Mac.

Python (x, y): Jest to darmowa dystrybucja Pythona ze stosem SciPy i Spyder IDE dla systemu operacyjnego Windows. (Do pobrania z www.python-xy.github.io/ )

Linux

Menedżery pakietów odpowiednich dystrybucji Linuksa są używane do instalowania jednego lub więcej pakietów w stosie SciPy.

W przypadku Ubuntu

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

W przypadku Fedory

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

Budynek ze źródła

Core Python (od wersji 2.6.x, 2.7.x i 3.2.x) musi być zainstalowany z distutils, a moduł zlib powinien być włączony.

Musi być dostępny kompilator GNU gcc (4.2 i nowsze) C.

Aby zainstalować NumPy, uruchom następujące polecenie.

Python setup.py install

Sprawdźmy, czy moduł NumPy jest poprawnie zainstalowany, spróbuj zaimportować go z zachęty Pythona.

Jeśli nie jest zainstalowany, zostanie wyświetlony następujący komunikat o błędzie.

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

Podobnie możemy sprawdzić, czy zainstalowano wszystkie wymagane pakiety nauki o danych, przedstawione w następnych rozdziałach.