Python - konfiguracja środowiska nauki o danych
Aby pomyślnie utworzyć i uruchomić przykładowy kod w tym samouczku, będziemy potrzebować skonfigurowanego środowiska, które będzie zawierało zarówno język Python ogólnego przeznaczenia, jak i specjalne pakiety wymagane do nauki o danych. Najpierw przyjrzymy się instalacji Pythona ogólnego przeznaczenia, którym może być python 2 lub python 3. Jednak w tym samouczku będziemy preferować Pythona 2, głównie ze względu na jego dojrzałość i szerszą obsługę pakietów zewnętrznych.
Pobieranie Pythona
Najbardziej aktualny i aktualny kod źródłowy, pliki binarne, dokumentacja, aktualności itp. Są dostępne na oficjalnej stronie Pythona https://www.python.org/
Możesz pobrać dokumentację Pythona z https://www.python.org/doc/. Dokumentacja jest dostępna w formatach HTML, PDF i PostScript.
Instalowanie Pythona
Dystrybucja Pythona jest dostępna na wiele różnych platform. Musisz pobrać tylko kod binarny odpowiedni dla Twojej platformy i zainstalować Python.
Jeśli kod binarny dla Twojej platformy nie jest dostępny, potrzebujesz kompilatora C do ręcznej kompilacji kodu źródłowego. Kompilowanie kodu źródłowego zapewnia większą elastyczność pod względem wyboru funkcji wymaganych w instalacji.
Oto krótki przegląd instalacji Pythona na różnych platformach -
Instalacja w systemach Unix i Linux
Oto proste kroki instalacji Pythona na komputerze z systemem Unix / Linux.
Otwórz przeglądarkę internetową i przejdź do https://www.python.org/downloads/.
Kliknij łącze, aby pobrać spakowany kod źródłowy dostępny dla systemów Unix / Linux.
Pobierz i rozpakuj pliki.
Edycja pliku modułów / ustawień , jeśli chcesz dostosować niektóre opcje.
uruchom skrypt ./configure
make
dokonać instalacji
Spowoduje to zainstalowanie Pythona w standardowej lokalizacji / usr / local / bin i jego bibliotek w / usr / local / lib / pythonXX, gdzie XX to wersja Pythona.
Instalacja systemu Windows
Oto kroki instalacji Pythona na komputerze z systemem Windows.
Otwórz przeglądarkę internetową i przejdź do https://www.python.org/downloads/.
Skorzystaj z łącza do pliku instalatora Windows python-XYZ.msi , gdzie XYZ to wersja, którą musisz zainstalować.
Aby użyć tego instalatora python-XYZ.msi , system Windows musi obsługiwać Microsoft Installer 2.0. Zapisz plik instalatora na komputerze lokalnym, a następnie uruchom go, aby sprawdzić, czy Twój komputer obsługuje MSI.
Uruchom pobrany plik. Spowoduje to wyświetlenie kreatora instalacji języka Python, który jest naprawdę łatwy w użyciu. Po prostu zaakceptuj ustawienia domyślne, poczekaj, aż instalacja zostanie zakończona i gotowe.
Instalacja na komputerze Macintosh
Najnowsze komputery Mac są dostarczane z zainstalowanym językiem Python, ale może on być kilka lat nieaktualny. Widziećhttp://www.python.org/download/mac/aby uzyskać instrukcje dotyczące uzyskiwania aktualnej wersji wraz z dodatkowymi narzędziami do obsługi programowania na komputerze Mac. W przypadku starszych systemów Mac OS wcześniejszych niż Mac OS X 10.3 (wydany w 2003 r.) Dostępny jest MacPython.
Utrzymuje go Jack Jansen, a do całej dokumentacji można mieć pełny dostęp na jego stronie internetowej - http://www.cwi.nl/~jack/macpython.html. Możesz znaleźć pełne szczegóły dotyczące instalacji systemu Mac OS.
Konfigurowanie PATH
Programy i inne pliki wykonywalne mogą znajdować się w wielu katalogach, więc systemy operacyjne zapewniają ścieżkę wyszukiwania zawierającą listę katalogów przeszukiwanych przez system operacyjny w poszukiwaniu plików wykonywalnych.
Ścieżka jest przechowywana w zmiennej środowiskowej, która jest nazwanym ciągiem obsługiwanym przez system operacyjny. Ta zmienna zawiera informacje dostępne dla powłoki poleceń i innych programów.
Plik path zmienna nosi nazwę PATH w systemie Unix lub Path w systemie Windows (w systemie Unix rozróżniana jest wielkość liter; w systemie Windows nie).
W systemie Mac OS instalator obsługuje szczegóły ścieżki. Aby wywołać interpreter języka Python z dowolnego katalogu, musisz dodać katalog Python do swojej ścieżki.
Ustawianie ścieżki w Unix / Linux
Aby dodać katalog Pythona do ścieżki dla określonej sesji w systemie Unix -
In the csh shell - wpisz setenv PATH "$ PATH: / usr / local / bin / python" i naciśnij Enter.
In the bash shell (Linux) - wpisz export ATH = "$ PATH: / usr / local / bin / python" i naciśnij Enter.
In the sh or ksh shell - wpisz PATH = "$ PATH: / usr / local / bin / python" i naciśnij Enter.
Note - / usr / local / bin / python to ścieżka do katalogu Pythona
Ustawianie ścieżki w systemie Windows
Aby dodać katalog Python do ścieżki dla określonej sesji w systemie Windows -
At the command prompt - wpisz path% path%; C: \ Python i naciśnij Enter.
Note - C: \ Python to ścieżka do katalogu Pythona
Zmienne środowiskowe Pythona
Oto ważne zmienne środowiskowe, które można rozpoznać w Pythonie -
Sr.No. | Zmienna i opis |
---|---|
1 | PYTHONPATH Pełni rolę podobną do PATH. Ta zmienna informuje interpreter języka Python, gdzie ma znaleźć pliki modułów zaimportowane do programu. Powinien zawierać katalog biblioteki źródłowej Pythona i katalogi zawierające kod źródłowy Pythona. PYTHONPATH jest czasami wstępnie ustawiana przez instalator Pythona. |
2 | PYTHONSTARTUP Zawiera ścieżkę do pliku inicjalizacyjnego zawierającego kod źródłowy Pythona. Jest wykonywany za każdym razem, gdy uruchamiasz tłumacza. Nazywa się .pythonrc.py w systemie Unix i zawiera polecenia, które ładują narzędzia lub modyfikują PYTHONPATH. |
3 | PYTHONCASEOK Jest używany w systemie Windows do instruowania Pythona, aby znalazł pierwsze dopasowanie bez uwzględniania wielkości liter w instrukcji importu. Ustaw tę zmienną na dowolną wartość, aby ją aktywować. |
4 | PYTHONHOME Jest to alternatywna ścieżka wyszukiwania modułu. Zwykle jest osadzony w katalogach PYTHONSTARTUP lub PYTHONPATH, aby ułatwić przełączanie bibliotek modułów. |
Uruchamianie Pythona
Istnieją trzy różne sposoby uruchomienia Pythona -
Interaktywny tłumacz
Możesz uruchomić Pythona z systemu Unix, DOS lub dowolnego innego systemu, który udostępnia interpreter wiersza poleceń lub okno powłoki.
Wchodzić python wiersz poleceń.
Rozpocznij kodowanie od razu w interaktywnym tłumaczu.
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
Oto lista wszystkich dostępnych opcji wiersza poleceń -
Sr.No. | Opcja i opis |
---|---|
1 | -d Zapewnia wyjście debugowania. |
2 | -O Generuje zoptymalizowany kod bajtowy (w wyniku czego powstają pliki .pyo). |
3 | -S Nie uruchamiaj witryny importu w celu wyszukania ścieżek Pythona podczas uruchamiania. |
4 | -v szczegółowe dane wyjściowe (szczegółowe śledzenie instrukcji importu). |
5 | -X wyłącz wbudowane wyjątki oparte na klasach (użyj po prostu ciągów znaków); przestarzałe począwszy od wersji 1.6. |
6 | -c cmd uruchom skrypt Pythona wysłany jako ciąg cmd |
7 | file uruchom skrypt Pythona z podanego pliku |
Skrypt z wiersza poleceń
Skrypt Pythona można wykonać w wierszu poleceń, wywołując interpreter w aplikacji, jak w poniższym przykładzie -
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - Upewnij się, że tryb uprawnień do plików umożliwia wykonanie.
Zintegrowane środowisko programistyczne
Możesz również uruchomić Python ze środowiska graficznego interfejsu użytkownika (GUI), jeśli masz aplikację GUI w systemie, która obsługuje język Python.
Unix - IDLE jest pierwszym IDE Uniksa dla Pythona.
Windows - PythonWin jest pierwszym interfejsem Windows dla Pythona i jest IDE z GUI.
Macintosh - Wersja Pythona dla komputerów Macintosh wraz z IDLE IDE jest dostępna z głównej strony internetowej, do pobrania jako pliki MacBinary lub BinHex'd.
Instalowanie pakietu SciPy
Najlepszym sposobem włączenia wymaganych pakietów jest użycie instalowalnego pakietu binarnego odpowiedniego dla Twojego systemu operacyjnego. Te pliki binarne zawierają pełny stos SciPy (w tym pakiety NumPy, SciPy, matplotlib, IPython, SymPy i nos wraz z podstawowym językiem Python).
Windows
Anaconda (z www.continuum.io ) to darmowa dystrybucja Pythona dla stosu SciPy. Jest również dostępny dla systemów Linux i Mac.
Canopy ( www.enthought.com/products/canopy/ ) jest dostępna jako bezpłatna i komercyjna dystrybucja z pełnym stosem SciPy dla systemów Windows, Linux i Mac.
Python (x, y): Jest to darmowa dystrybucja Pythona ze stosem SciPy i Spyder IDE dla systemu operacyjnego Windows. (Do pobrania z www.python-xy.github.io/ )
Linux
Menedżery pakietów odpowiednich dystrybucji Linuksa są używane do instalowania jednego lub więcej pakietów w stosie SciPy.
W przypadku Ubuntu
sudo apt-get install python-numpy
python-scipy python-matplotlibipythonipythonnotebook python-pandas
python-sympy python-nose
W przypadku Fedory
sudo yum install numpyscipy python-matplotlibipython
python-pandas sympy python-nose atlas-devel
Budynek ze źródła
Core Python (od wersji 2.6.x, 2.7.x i 3.2.x) musi być zainstalowany z distutils, a moduł zlib powinien być włączony.
Musi być dostępny kompilator GNU gcc (4.2 i nowsze) C.
Aby zainstalować NumPy, uruchom następujące polecenie.
Python setup.py install
Sprawdźmy, czy moduł NumPy jest poprawnie zainstalowany, spróbuj zaimportować go z zachęty Pythona.
Jeśli nie jest zainstalowany, zostanie wyświetlony następujący komunikat o błędzie.
Traceback (most recent call last):
File "<pyshell#0>", line 1, in <module>
import numpy
ImportError: No module named 'numpy'
Podobnie możemy sprawdzić, czy zainstalowano wszystkie wymagane pakiety nauki o danych, przedstawione w następnych rozdziałach.