Python - środowisko przetwarzania tekstu

Aby pomyślnie utworzyć i uruchomić przykładowy kod w tym samouczku, będziemy potrzebować skonfigurowanego środowiska, które będzie zawierało zarówno język Python ogólnego przeznaczenia, jak i specjalne pakiety wymagane do nauki o danych. Najpierw przyjrzymy się instalacji Pythona ogólnego przeznaczenia, którym może być python 2 lub python 3. Jednak w tym samouczku będziemy preferować Pythona 2, głównie ze względu na jego dojrzałość i szerszą obsługę pakietów zewnętrznych.

Pobieranie Pythona

Najbardziej aktualny i aktualny kod źródłowy, pliki binarne, dokumentacja, aktualności itp. Są dostępne na oficjalnej stronie Pythona https://www.python.org/

Możesz pobrać dokumentację Pythona z https://www.python.org/doc/. Dokumentacja jest dostępna w formatach HTML, PDF i PostScript.

Instalowanie Pythona

Dystrybucja Pythona jest dostępna na wiele różnych platform. Musisz pobrać tylko kod binarny odpowiedni dla Twojej platformy i zainstalować Python.

Jeśli kod binarny dla Twojej platformy nie jest dostępny, potrzebujesz kompilatora C do ręcznej kompilacji kodu źródłowego. Kompilowanie kodu źródłowego zapewnia większą elastyczność pod względem wyboru funkcji wymaganych w instalacji.

Oto krótki przegląd instalacji Pythona na różnych platformach -

Instalacja w systemach Unix i Linux

Oto proste kroki instalacji Pythona na komputerze z systemem Unix / Linux.

  • Otwórz przeglądarkę internetową i przejdź do https://www.python.org/downloads/.

  • Kliknij łącze, aby pobrać spakowany kod źródłowy dostępny dla systemów Unix / Linux.

  • Pobierz i rozpakuj pliki.

  • Edycja pliku modułów / ustawień , jeśli chcesz dostosować niektóre opcje.

  • uruchom skrypt ./configure

  • make

  • dokonać instalacji

Spowoduje to zainstalowanie Pythona w standardowej lokalizacji / usr / local / bin i jego bibliotek w / usr / local / lib / pythonXX, gdzie XX to wersja Pythona.

Instalacja systemu Windows

Oto kroki instalacji Pythona na komputerze z systemem Windows.

  • Otwórz przeglądarkę internetową i przejdź do https://www.python.org/downloads/.

  • Skorzystaj z łącza do pliku instalatora Windows python-XYZ.msi , gdzie XYZ to wersja, którą musisz zainstalować.

  • Aby użyć tego instalatora python-XYZ.msi , system Windows musi obsługiwać Microsoft Installer 2.0. Zapisz plik instalatora na komputerze lokalnym, a następnie uruchom go, aby sprawdzić, czy Twój komputer obsługuje MSI.

  • Uruchom pobrany plik. Spowoduje to wyświetlenie kreatora instalacji języka Python, który jest naprawdę łatwy w użyciu. Po prostu zaakceptuj ustawienia domyślne, poczekaj, aż instalacja zostanie zakończona i gotowe.

Instalacja na komputerze Macintosh

Najnowsze komputery Mac są dostarczane z zainstalowanym Pythonem, ale może on być nieaktualny przez kilka lat. Widziećhttp://www.python.org/download/mac/aby uzyskać instrukcje dotyczące uzyskiwania aktualnej wersji wraz z dodatkowymi narzędziami do obsługi programowania na komputerze Mac. Dla starszych systemów Mac OS wcześniejszych niż Mac OS X 10.3 (wydany w 2003 r.) Dostępny jest MacPython.

Utrzymuje go Jack Jansen i możesz mieć pełny dostęp do całej dokumentacji na jego stronie internetowej - http://www.cwi.nl/~jack/macpython.html. Możesz znaleźć pełne szczegóły dotyczące instalacji systemu Mac OS.

Konfigurowanie PATH

Programy i inne pliki wykonywalne mogą znajdować się w wielu katalogach, więc systemy operacyjne zapewniają ścieżkę wyszukiwania zawierającą listę katalogów przeszukiwanych przez system operacyjny w poszukiwaniu plików wykonywalnych.

Ścieżka jest przechowywana w zmiennej środowiskowej, która jest nazwanym ciągiem obsługiwanym przez system operacyjny. Ta zmienna zawiera informacje dostępne dla powłoki poleceń i innych programów.

Plik path zmienna nosi nazwę PATH w systemie Unix lub Path w systemie Windows (w systemie Unix rozróżniana jest wielkość liter; Windows nie).

W systemie Mac OS instalator obsługuje szczegóły ścieżki. Aby wywołać interpreter języka Python z dowolnego katalogu, musisz dodać katalog Python do swojej ścieżki.

Ustawianie ścieżki w Unix / Linux

Aby dodać katalog Pythona do ścieżki dla określonej sesji w systemie Unix -

  • In the csh shell - wpisz setenv PATH "$ PATH: / usr / local / bin / python" i naciśnij Enter.

  • In the bash shell (Linux) - wpisz export ATH = "$ PATH: / usr / local / bin / python" i naciśnij Enter.

  • In the sh or ksh shell - wpisz PATH = "$ PATH: / usr / local / bin / python" i naciśnij Enter.

  • Note - / usr / local / bin / python to ścieżka do katalogu Pythona

Ustawianie ścieżki w systemie Windows

Aby dodać katalog Python do ścieżki dla określonej sesji w systemie Windows -

At the command prompt - wpisz path% path%; C: \ Python i naciśnij Enter.

Note - C: \ Python to ścieżka do katalogu Pythona

Zmienne środowiskowe Pythona

Oto ważne zmienne środowiskowe, które mogą być rozpoznawane przez Pythona -

Sr.No. Zmienna i opis
1

PYTHONPATH

Pełni rolę podobną do PATH. Ta zmienna informuje interpreter języka Python, gdzie ma znaleźć pliki modułów zaimportowane do programu. Powinien zawierać katalog biblioteki źródłowej Pythona i katalogi zawierające kod źródłowy Pythona. PYTHONPATH jest czasami wstępnie ustawiana przez instalator Pythona.

2

PYTHONSTARTUP

Zawiera ścieżkę do pliku inicjalizacyjnego zawierającego kod źródłowy Pythona. Jest wykonywany za każdym razem, gdy uruchamiasz tłumacza. Nazywa się .pythonrc.py w systemie Unix i zawiera polecenia, które ładują narzędzia lub modyfikują PYTHONPATH.

3

PYTHONCASEOK

Jest używany w systemie Windows do instruowania Pythona, aby znalazł pierwsze dopasowanie bez uwzględniania wielkości liter w instrukcji importu. Ustaw tę zmienną na dowolną wartość, aby ją aktywować.

4

PYTHONHOME

Jest to alternatywna ścieżka wyszukiwania modułu. Zwykle jest osadzony w katalogach PYTHONSTARTUP lub PYTHONPATH, aby ułatwić przełączanie bibliotek modułów.

Uruchamianie Pythona

Istnieją trzy różne sposoby uruchomienia Pythona -

Interaktywny tłumacz

Możesz uruchomić Pythona z systemu Unix, DOS lub dowolnego innego systemu, który udostępnia interpreter wiersza poleceń lub okno powłoki.

Wchodzić python wiersz poleceń.

Rozpocznij kodowanie od razu w interaktywnym tłumaczu.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Oto lista wszystkich dostępnych opcji wiersza poleceń -

Sr.No. Opcja i opis
1

-d

Zapewnia wyjście debugowania.

2

-O

Generuje zoptymalizowany kod bajtowy (w wyniku czego powstają pliki .pyo).

3

-S

Nie uruchamiaj witryny importu w celu wyszukania ścieżek Pythona podczas uruchamiania.

4

-v

szczegółowe dane wyjściowe (szczegółowe śledzenie instrukcji importu).

5

-X

wyłącz wbudowane wyjątki oparte na klasach (użyj po prostu ciągów znaków); przestarzałe począwszy od wersji 1.6.

6

-c cmd

uruchom skrypt Pythona wysłany jako ciąg cmd

7

file

uruchom skrypt Pythona z podanego pliku

Skrypt z wiersza poleceń

Skrypt w języku Python można wykonać w wierszu poleceń, wywołując interpreter w aplikacji, jak poniżej -

$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or 
C: >python script.py # Windows/DOS

Note - Upewnij się, że tryb uprawnień do plików umożliwia wykonanie.

Zintegrowane środowisko programistyczne

Możesz również uruchomić język Python ze środowiska graficznego interfejsu użytkownika (GUI), jeśli masz aplikację GUI w systemie, która obsługuje język Python.

  • Unix - IDLE jest pierwszym IDE Uniksa dla Pythona.

  • Windows - PythonWin jest pierwszym interfejsem Windows dla Pythona i jest IDE z GUI.

  • Macintosh - Wersja Pythona dla komputerów Macintosh wraz z IDLE IDE jest dostępna z głównej strony internetowej, do pobrania jako pliki MacBinary lub BinHex'd.

Instalowanie pakietu NLTK

NLTK jest bardzo prosty w integracji ze środowiskiem Pythona. Użyj poniższego polecenia, aby dodać NLTK do środowiska.

sudo pip install -U nltk

Dodawanie innych bibliotek zostanie omówione w każdym rozdziale, gdy zajdzie potrzeba ich użycia w programie w języku Python.