Python - środowisko przetwarzania tekstu
Aby pomyślnie utworzyć i uruchomić przykładowy kod w tym samouczku, będziemy potrzebować skonfigurowanego środowiska, które będzie zawierało zarówno język Python ogólnego przeznaczenia, jak i specjalne pakiety wymagane do nauki o danych. Najpierw przyjrzymy się instalacji Pythona ogólnego przeznaczenia, którym może być python 2 lub python 3. Jednak w tym samouczku będziemy preferować Pythona 2, głównie ze względu na jego dojrzałość i szerszą obsługę pakietów zewnętrznych.
Pobieranie Pythona
Najbardziej aktualny i aktualny kod źródłowy, pliki binarne, dokumentacja, aktualności itp. Są dostępne na oficjalnej stronie Pythona https://www.python.org/
Możesz pobrać dokumentację Pythona z https://www.python.org/doc/. Dokumentacja jest dostępna w formatach HTML, PDF i PostScript.
Instalowanie Pythona
Dystrybucja Pythona jest dostępna na wiele różnych platform. Musisz pobrać tylko kod binarny odpowiedni dla Twojej platformy i zainstalować Python.
Jeśli kod binarny dla Twojej platformy nie jest dostępny, potrzebujesz kompilatora C do ręcznej kompilacji kodu źródłowego. Kompilowanie kodu źródłowego zapewnia większą elastyczność pod względem wyboru funkcji wymaganych w instalacji.
Oto krótki przegląd instalacji Pythona na różnych platformach -
Instalacja w systemach Unix i Linux
Oto proste kroki instalacji Pythona na komputerze z systemem Unix / Linux.
Otwórz przeglądarkę internetową i przejdź do https://www.python.org/downloads/.
Kliknij łącze, aby pobrać spakowany kod źródłowy dostępny dla systemów Unix / Linux.
Pobierz i rozpakuj pliki.
Edycja pliku modułów / ustawień , jeśli chcesz dostosować niektóre opcje.
uruchom skrypt ./configure
make
dokonać instalacji
Spowoduje to zainstalowanie Pythona w standardowej lokalizacji / usr / local / bin i jego bibliotek w / usr / local / lib / pythonXX, gdzie XX to wersja Pythona.
Instalacja systemu Windows
Oto kroki instalacji Pythona na komputerze z systemem Windows.
Otwórz przeglądarkę internetową i przejdź do https://www.python.org/downloads/.
Skorzystaj z łącza do pliku instalatora Windows python-XYZ.msi , gdzie XYZ to wersja, którą musisz zainstalować.
Aby użyć tego instalatora python-XYZ.msi , system Windows musi obsługiwać Microsoft Installer 2.0. Zapisz plik instalatora na komputerze lokalnym, a następnie uruchom go, aby sprawdzić, czy Twój komputer obsługuje MSI.
Uruchom pobrany plik. Spowoduje to wyświetlenie kreatora instalacji języka Python, który jest naprawdę łatwy w użyciu. Po prostu zaakceptuj ustawienia domyślne, poczekaj, aż instalacja zostanie zakończona i gotowe.
Instalacja na komputerze Macintosh
Najnowsze komputery Mac są dostarczane z zainstalowanym Pythonem, ale może on być nieaktualny przez kilka lat. Widziećhttp://www.python.org/download/mac/aby uzyskać instrukcje dotyczące uzyskiwania aktualnej wersji wraz z dodatkowymi narzędziami do obsługi programowania na komputerze Mac. Dla starszych systemów Mac OS wcześniejszych niż Mac OS X 10.3 (wydany w 2003 r.) Dostępny jest MacPython.
Utrzymuje go Jack Jansen i możesz mieć pełny dostęp do całej dokumentacji na jego stronie internetowej - http://www.cwi.nl/~jack/macpython.html. Możesz znaleźć pełne szczegóły dotyczące instalacji systemu Mac OS.
Konfigurowanie PATH
Programy i inne pliki wykonywalne mogą znajdować się w wielu katalogach, więc systemy operacyjne zapewniają ścieżkę wyszukiwania zawierającą listę katalogów przeszukiwanych przez system operacyjny w poszukiwaniu plików wykonywalnych.
Ścieżka jest przechowywana w zmiennej środowiskowej, która jest nazwanym ciągiem obsługiwanym przez system operacyjny. Ta zmienna zawiera informacje dostępne dla powłoki poleceń i innych programów.
Plik path zmienna nosi nazwę PATH w systemie Unix lub Path w systemie Windows (w systemie Unix rozróżniana jest wielkość liter; Windows nie).
W systemie Mac OS instalator obsługuje szczegóły ścieżki. Aby wywołać interpreter języka Python z dowolnego katalogu, musisz dodać katalog Python do swojej ścieżki.
Ustawianie ścieżki w Unix / Linux
Aby dodać katalog Pythona do ścieżki dla określonej sesji w systemie Unix -
In the csh shell - wpisz setenv PATH "$ PATH: / usr / local / bin / python" i naciśnij Enter.
In the bash shell (Linux) - wpisz export ATH = "$ PATH: / usr / local / bin / python" i naciśnij Enter.
In the sh or ksh shell - wpisz PATH = "$ PATH: / usr / local / bin / python" i naciśnij Enter.
Note - / usr / local / bin / python to ścieżka do katalogu Pythona
Ustawianie ścieżki w systemie Windows
Aby dodać katalog Python do ścieżki dla określonej sesji w systemie Windows -
At the command prompt - wpisz path% path%; C: \ Python i naciśnij Enter.
Note - C: \ Python to ścieżka do katalogu Pythona
Zmienne środowiskowe Pythona
Oto ważne zmienne środowiskowe, które mogą być rozpoznawane przez Pythona -
Sr.No. | Zmienna i opis |
---|---|
1 | PYTHONPATH Pełni rolę podobną do PATH. Ta zmienna informuje interpreter języka Python, gdzie ma znaleźć pliki modułów zaimportowane do programu. Powinien zawierać katalog biblioteki źródłowej Pythona i katalogi zawierające kod źródłowy Pythona. PYTHONPATH jest czasami wstępnie ustawiana przez instalator Pythona. |
2 | PYTHONSTARTUP Zawiera ścieżkę do pliku inicjalizacyjnego zawierającego kod źródłowy Pythona. Jest wykonywany za każdym razem, gdy uruchamiasz tłumacza. Nazywa się .pythonrc.py w systemie Unix i zawiera polecenia, które ładują narzędzia lub modyfikują PYTHONPATH. |
3 | PYTHONCASEOK Jest używany w systemie Windows do instruowania Pythona, aby znalazł pierwsze dopasowanie bez uwzględniania wielkości liter w instrukcji importu. Ustaw tę zmienną na dowolną wartość, aby ją aktywować. |
4 | PYTHONHOME Jest to alternatywna ścieżka wyszukiwania modułu. Zwykle jest osadzony w katalogach PYTHONSTARTUP lub PYTHONPATH, aby ułatwić przełączanie bibliotek modułów. |
Uruchamianie Pythona
Istnieją trzy różne sposoby uruchomienia Pythona -
Interaktywny tłumacz
Możesz uruchomić Pythona z systemu Unix, DOS lub dowolnego innego systemu, który udostępnia interpreter wiersza poleceń lub okno powłoki.
Wchodzić python wiersz poleceń.
Rozpocznij kodowanie od razu w interaktywnym tłumaczu.
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
Oto lista wszystkich dostępnych opcji wiersza poleceń -
Sr.No. | Opcja i opis |
---|---|
1 | -d Zapewnia wyjście debugowania. |
2 | -O Generuje zoptymalizowany kod bajtowy (w wyniku czego powstają pliki .pyo). |
3 | -S Nie uruchamiaj witryny importu w celu wyszukania ścieżek Pythona podczas uruchamiania. |
4 | -v szczegółowe dane wyjściowe (szczegółowe śledzenie instrukcji importu). |
5 | -X wyłącz wbudowane wyjątki oparte na klasach (użyj po prostu ciągów znaków); przestarzałe począwszy od wersji 1.6. |
6 | -c cmd uruchom skrypt Pythona wysłany jako ciąg cmd |
7 | file uruchom skrypt Pythona z podanego pliku |
Skrypt z wiersza poleceń
Skrypt w języku Python można wykonać w wierszu poleceń, wywołując interpreter w aplikacji, jak poniżej -
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - Upewnij się, że tryb uprawnień do plików umożliwia wykonanie.
Zintegrowane środowisko programistyczne
Możesz również uruchomić język Python ze środowiska graficznego interfejsu użytkownika (GUI), jeśli masz aplikację GUI w systemie, która obsługuje język Python.
Unix - IDLE jest pierwszym IDE Uniksa dla Pythona.
Windows - PythonWin jest pierwszym interfejsem Windows dla Pythona i jest IDE z GUI.
Macintosh - Wersja Pythona dla komputerów Macintosh wraz z IDLE IDE jest dostępna z głównej strony internetowej, do pobrania jako pliki MacBinary lub BinHex'd.
Instalowanie pakietu NLTK
NLTK jest bardzo prosty w integracji ze środowiskiem Pythona. Użyj poniższego polecenia, aby dodać NLTK do środowiska.
sudo pip install -U nltk
Dodawanie innych bibliotek zostanie omówione w każdym rozdziale, gdy zajdzie potrzeba ich użycia w programie w języku Python.