Python - Lingkungan Pemrosesan Teks

Agar berhasil membuat dan menjalankan kode contoh dalam tutorial ini kita akan membutuhkan pengaturan lingkungan yang akan memiliki python untuk keperluan umum serta paket khusus yang diperlukan untuk ilmu Data. Pertama-tama kita akan melihat seperti menginstal python untuk keperluan umum yang dapat berupa python 2 atau python 3. Tetapi kami akan lebih memilih python 2 untuk tutorial ini terutama karena kematangannya dan dukungan yang lebih luas dari paket eksternal.

Mendapatkan Python

Kode sumber terbaru dan terkini, binari, dokumentasi, berita, dll., Tersedia di situs web resmi Python https://www.python.org/

Anda dapat mengunduh dokumentasi Python dari https://www.python.org/doc/. Dokumentasi tersedia dalam format HTML, PDF, dan PostScript.

Menginstal Python

Distribusi Python tersedia untuk berbagai macam platform. Anda hanya perlu mengunduh kode biner yang berlaku untuk platform Anda dan menginstal Python.

Jika kode biner untuk platform Anda tidak tersedia, Anda memerlukan compiler C untuk mengompilasi kode sumber secara manual. Mengompilasi kode sumber menawarkan lebih banyak fleksibilitas dalam hal pilihan fitur yang Anda perlukan dalam instalasi Anda.

Berikut ini gambaran umum singkat tentang menginstal Python di berbagai platform -

Instalasi Unix dan Linux

Berikut adalah langkah-langkah sederhana untuk menginstal Python di mesin Unix / Linux.

  • Buka browser web dan buka https://www.python.org/downloads/.

  • Ikuti tautan untuk mengunduh kode sumber zip yang tersedia untuk Unix / Linux.

  • Unduh dan ekstrak file.

  • Mengedit file Modules / Setup jika Anda ingin menyesuaikan beberapa opsi.

  • jalankan ./configure script

  • make

  • buat instal

Ini menginstal Python di lokasi standar / usr / local / bin dan perpustakaannya di / usr / local / lib / pythonXX di mana XX adalah versi Python.

Instalasi Windows

Berikut adalah langkah-langkah untuk menginstal Python di mesin Windows.

  • Buka browser web dan buka https://www.python.org/downloads/.

  • Ikuti tautan untuk file python-XYZ.msi penginstal Windows di mana XYZ adalah versi yang perlu Anda instal.

  • Untuk menggunakan installer python-XYZ.msi ini , sistem Windows harus mendukung Microsoft Installer 2.0. Simpan file pemasang ke mesin lokal Anda dan kemudian jalankan untuk mengetahui apakah mesin Anda mendukung MSI.

  • Jalankan file yang diunduh. Ini menampilkan wizard pemasangan Python, yang sangat mudah digunakan. Terima saja pengaturan default, tunggu sampai penginstalan selesai, dan Anda selesai.

Instalasi Macintosh

Mac terbaru sudah dilengkapi dengan Python, tetapi mungkin sudah beberapa tahun kedaluwarsa. Lihathttp://www.python.org/download/mac/untuk instruksi tentang mendapatkan versi saat ini bersama dengan alat tambahan untuk mendukung pengembangan di Mac. Untuk Mac OS yang lebih lama sebelum Mac OS X 10.3 (dirilis pada 2003), MacPython tersedia.

Jack Jansen memeliharanya dan Anda dapat memiliki akses penuh ke seluruh dokumentasi di situsnya - http://www.cwi.nl/~jack/macpython.html. Anda dapat menemukan detail penginstalan lengkap untuk penginstalan Mac OS.

Menyiapkan PATH

Program dan file yang dapat dijalankan lainnya dapat berada di banyak direktori, sehingga sistem operasi menyediakan jalur pencarian yang mencantumkan direktori yang dicari OS untuk dapat dieksekusi.

Path disimpan dalam variabel lingkungan, yang merupakan string bernama yang dikelola oleh sistem operasi. Variabel ini berisi informasi yang tersedia untuk shell perintah dan program lain.

Itu path variabel dinamai sebagai PATH di Unix atau Path di Windows (Unix peka huruf besar kecil; Windows tidak).

Di Mac OS, penginstal menangani detail jalur. Untuk memanggil interpreter Python dari direktori tertentu, Anda harus menambahkan direktori Python ke jalur Anda.

Jalur pengaturan di Unix / Linux

Untuk menambahkan direktori Python ke jalur untuk sesi tertentu di Unix -

  • In the csh shell - ketik setenv PATH "$ PATH: / usr / local / bin / python" dan tekan Enter.

  • In the bash shell (Linux) - ketik export ATH = "$ PATH: / usr / local / bin / python" dan tekan Enter.

  • In the sh or ksh shell - ketik PATH = "$ PATH: / usr / local / bin / python" dan tekan Enter.

  • Note - / usr / local / bin / python adalah jalur direktori Python

Jalur pengaturan di Windows

Untuk menambahkan direktori Python ke jalur untuk sesi tertentu di Windows -

At the command prompt - ketik path% path%; C: \ Python dan tekan Enter.

Note - C: \ Python adalah jalur direktori Python

Variabel Lingkungan Python

Berikut adalah variabel lingkungan penting, yang dapat dikenali oleh Python -

Sr.No. Variabel & Deskripsi
1

PYTHONPATH

Ini memiliki peran yang mirip dengan PATH. Variabel ini memberi tahu interpreter Python di mana menemukan file modul yang diimpor ke dalam program. Ini harus menyertakan direktori pustaka sumber Python dan direktori yang berisi kode sumber Python. PYTHONPATH terkadang sudah diatur sebelumnya oleh pemasang Python.

2

PYTHONSTARTUP

Ini berisi jalur file inisialisasi yang berisi kode sumber Python. Ini dijalankan setiap kali Anda memulai penerjemah. Ini dinamai sebagai .pythonrc.py di Unix dan berisi perintah yang memuat utilitas atau memodifikasi PYTHONPATH.

3

PYTHONCASEOK

Ini digunakan di Windows untuk menginstruksikan Python untuk menemukan kecocokan case-insensitive pertama dalam pernyataan import. Setel variabel ini ke nilai apa pun untuk mengaktifkannya.

4

PYTHONHOME

Ini adalah jalur pencarian modul alternatif. Ini biasanya tertanam di direktori PYTHONSTARTUP atau PYTHONPATH untuk membuat pustaka modul beralih dengan mudah.

Menjalankan Python

Ada tiga cara berbeda untuk memulai Python -

Penerjemah Interaktif

Anda dapat memulai Python dari Unix, DOS, atau sistem lain yang memberi Anda penafsir baris perintah atau jendela shell.

Memasukkan python baris perintah.

Mulai coding segera di interpreter interaktif.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Berikut adalah daftar semua opsi baris perintah yang tersedia -

Sr.No. Opsi & Deskripsi
1

-d

Ini memberikan keluaran debug.

2

-O

Ini menghasilkan bytecode yang dioptimalkan (menghasilkan file .pyo).

3

-S

Jangan menjalankan import situs untuk mencari jalur Python saat memulai.

4

-v

keluaran verbose (jejak rinci pada pernyataan impor).

5

-X

nonaktifkan pengecualian bawaan berbasis kelas (cukup gunakan string); usang dimulai dengan versi 1.6.

6

-c cmd

jalankan skrip Python yang dikirim sebagai string cmd

7

file

jalankan skrip Python dari file yang diberikan

Script dari Command-line

Skrip Python dapat dijalankan pada baris perintah dengan memanggil interpreter pada aplikasi Anda, seperti berikut ini -

$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or 
C: >python script.py # Windows/DOS

Note - Pastikan mode izin file memungkinkan eksekusi.

Lingkungan Pembangunan Terpadu

Anda juga dapat menjalankan Python dari lingkungan Graphical User Interface (GUI), jika Anda memiliki aplikasi GUI di sistem Anda yang mendukung Python.

  • Unix - IDLE adalah IDE Unix pertama untuk Python.

  • Windows - PythonWin adalah antarmuka Windows pertama untuk Python dan merupakan IDE dengan GUI.

  • Macintosh - Versi Macintosh dari Python bersama dengan IDLE IDE tersedia dari situs web utama, dapat diunduh sebagai file MacBinary atau BinHex.

Menginstal NLTK Pack

NLTK sangat mudah diintegrasikan ke dalam lingkungan python. Gunakan perintah di bawah ini untuk menambahkan NLTK ke lingkungan.

sudo pip install -U nltk

Penambahan pustaka lain akan dibahas di setiap bab jika kita membutuhkannya untuk digunakan dalam program python.