Python - Penyiapan Lingkungan Sains Data

Agar berhasil membuat dan menjalankan kode contoh dalam tutorial ini, kita memerlukan pengaturan lingkungan yang akan memiliki python untuk keperluan umum serta paket khusus yang diperlukan untuk ilmu Data. Pertama-tama kita akan melihat seperti menginstal python untuk keperluan umum yang dapat berupa python 2 atau python 3. Tetapi kami akan lebih memilih python 2 untuk tutorial ini terutama karena kematangannya dan dukungan yang lebih luas dari paket eksternal.

Mendapatkan Python

Kode sumber, binari, dokumentasi, berita, dll yang paling mutakhir dan terkini, tersedia di situs web resmi Python https://www.python.org/

Anda dapat mengunduh dokumentasi Python dari https://www.python.org/doc/. Dokumentasi tersedia dalam format HTML, PDF, dan PostScript.

Menginstal Python

Distribusi Python tersedia untuk berbagai macam platform. Anda hanya perlu mengunduh kode biner yang berlaku untuk platform Anda dan menginstal Python.

Jika kode biner untuk platform Anda tidak tersedia, Anda memerlukan compiler C untuk mengompilasi kode sumber secara manual. Mengompilasi kode sumber menawarkan lebih banyak fleksibilitas dalam hal pilihan fitur yang Anda perlukan dalam instalasi Anda.

Berikut ini gambaran umum singkat tentang menginstal Python di berbagai platform -

Instalasi Unix dan Linux

Berikut adalah langkah-langkah sederhana untuk menginstal Python di mesin Unix / Linux.

  • Buka browser web dan buka https://www.python.org/downloads/.

  • Ikuti tautan untuk mengunduh kode sumber zip yang tersedia untuk Unix / Linux.

  • Unduh dan ekstrak file.

  • Mengedit file Modules / Setup jika Anda ingin menyesuaikan beberapa opsi.

  • jalankan ./configure script

  • make

  • buat instal

Ini menginstal Python di lokasi standar / usr / local / bin dan perpustakaannya di / usr / local / lib / pythonXX di mana XX adalah versi Python.

Instalasi Windows

Berikut adalah langkah-langkah untuk menginstal Python di mesin Windows.

  • Buka browser web dan buka https://www.python.org/downloads/.

  • Ikuti tautan untuk file python-XYZ.msi penginstal Windows di mana XYZ adalah versi yang perlu Anda instal.

  • Untuk menggunakan installer python-XYZ.msi ini , sistem Windows harus mendukung Microsoft Installer 2.0. Simpan file pemasang ke komputer lokal Anda dan kemudian jalankan untuk mengetahui apakah mesin Anda mendukung MSI.

  • Jalankan file yang diunduh. Ini menampilkan wizard instalasi Python, yang sangat mudah digunakan. Cukup terima pengaturan default, tunggu hingga penginstalan selesai, dan Anda selesai.

Instalasi Macintosh

Mac terbaru dilengkapi dengan Python yang diinstal, tetapi mungkin sudah beberapa tahun kedaluwarsa. Lihathttp://www.python.org/download/mac/untuk instruksi tentang mendapatkan versi saat ini bersama dengan alat tambahan untuk mendukung pengembangan di Mac. Untuk Mac OS lama sebelum Mac OS X 10.3 (dirilis pada 2003), MacPython tersedia.

Jack Jansen memeliharanya dan Anda dapat memiliki akses penuh ke seluruh dokumentasi di situsnya - http://www.cwi.nl/~jack/macpython.html. Anda dapat menemukan detail penginstalan lengkap untuk penginstalan Mac OS.

Menyiapkan PATH

Program dan file yang dapat dijalankan lainnya dapat berada di banyak direktori, sehingga sistem operasi menyediakan jalur pencarian yang mencantumkan direktori yang dicari oleh OS untuk dapat dieksekusi.

Path disimpan dalam variabel lingkungan, yang merupakan string bernama yang dikelola oleh sistem operasi. Variabel ini berisi informasi yang tersedia untuk shell perintah dan program lain.

Itu path variabel dinamai sebagai PATH di Unix atau Path di Windows (Unix peka huruf besar / kecil; Windows tidak).

Di Mac OS, penginstal menangani detail jalur. Untuk memanggil interpreter Python dari direktori tertentu, Anda harus menambahkan direktori Python ke jalur Anda.

Setting path di Unix / Linux

Untuk menambahkan direktori Python ke jalur untuk sesi tertentu di Unix -

  • In the csh shell - ketik setenv PATH "$ PATH: / usr / local / bin / python" dan tekan Enter.

  • In the bash shell (Linux) - ketik export ATH = "$ PATH: / usr / local / bin / python" dan tekan Enter.

  • In the sh or ksh shell - ketik PATH = "$ PATH: / usr / local / bin / python" dan tekan Enter.

  • Note - / usr / local / bin / python adalah jalur direktori Python

Jalur pengaturan di Windows

Untuk menambahkan direktori Python ke jalur untuk sesi tertentu di Windows -

At the command prompt - ketik path% path%; C: \ Python dan tekan Enter.

Note - C: \ Python adalah jalur direktori Python

Variabel Lingkungan Python

Berikut adalah variabel lingkungan penting, yang dapat dikenali oleh Python -

Sr.No. Variabel & Deskripsi
1

PYTHONPATH

Ini memiliki peran yang mirip dengan PATH. Variabel ini memberi tahu interpreter Python di mana menemukan file modul yang diimpor ke dalam program. Ini harus menyertakan direktori pustaka sumber Python dan direktori yang berisi kode sumber Python. PYTHONPATH terkadang sudah diatur sebelumnya oleh pemasang Python.

2

PYTHONSTARTUP

Ini berisi jalur file inisialisasi yang berisi kode sumber Python. Ini dijalankan setiap kali Anda memulai penerjemah. Ini dinamai sebagai .pythonrc.py di Unix dan berisi perintah yang memuat utilitas atau memodifikasi PYTHONPATH.

3

PYTHONCASEOK

Ini digunakan di Windows untuk menginstruksikan Python untuk menemukan kecocokan case-insensitive pertama dalam pernyataan import. Setel variabel ini ke nilai apa pun untuk mengaktifkannya.

4

PYTHONHOME

Ini adalah jalur pencarian modul alternatif. Ini biasanya tertanam di direktori PYTHONSTARTUP atau PYTHONPATH untuk membuat pustaka modul beralih dengan mudah.

Menjalankan Python

Ada tiga cara berbeda untuk memulai Python -

Penerjemah Interaktif

Anda dapat memulai Python dari Unix, DOS, atau sistem lain yang memberi Anda penafsir baris perintah atau jendela shell.

Memasukkan python baris perintah.

Mulai coding segera di interpreter interaktif.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Berikut adalah daftar semua opsi baris perintah yang tersedia -

Sr.No. Opsi & Deskripsi
1

-d

Ini memberikan keluaran debug.

2

-O

Ini menghasilkan bytecode yang dioptimalkan (menghasilkan file .pyo).

3

-S

Jangan jalankan import situs untuk mencari jalur Python saat memulai.

4

-v

keluaran verbose (jejak rinci pada pernyataan impor).

5

-X

nonaktifkan pengecualian bawaan berbasis kelas (cukup gunakan string); usang dimulai dengan versi 1.6.

6

-c cmd

jalankan skrip Python yang dikirim sebagai string cmd

7

file

jalankan skrip Python dari file yang diberikan

Script dari Command-line

Skrip Python dapat dijalankan pada baris perintah dengan memanggil interpreter pada aplikasi Anda, seperti berikut ini -

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

Note - Pastikan mode izin file memungkinkan eksekusi.

Lingkungan Pembangunan Terpadu

Anda juga dapat menjalankan Python dari lingkungan Graphical User Interface (GUI), jika Anda memiliki aplikasi GUI di sistem Anda yang mendukung Python.

  • Unix - IDLE adalah IDE Unix pertama untuk Python.

  • Windows - PythonWin adalah antarmuka Windows pertama untuk Python dan merupakan IDE dengan GUI.

  • Macintosh - Versi Macintosh dari Python bersama dengan IDLE IDE tersedia dari situs web utama, dapat diunduh sebagai file MacBinary atau BinHex.

Menginstal SciPy Pack

Cara terbaik untuk mengaktifkan paket yang diperlukan adalah dengan menggunakan paket biner yang dapat diinstal khusus untuk sistem operasi Anda. Biner ini berisi tumpukan SciPy lengkap (termasuk paket NumPy, SciPy, matplotlib, IPython, SymPy dan nose bersama dengan inti Python).

Windows

Anaconda (dari www.continuum.io ) adalah distribusi Python gratis untuk tumpukan SciPy. Ini juga tersedia untuk Linux dan Mac.

Canopy ( www.enthought.com/products/canopy/ ) tersedia gratis serta distribusi komersial dengan tumpukan SciPy lengkap untuk Windows, Linux dan Mac.

Python (x, y): Ini adalah distribusi Python gratis dengan tumpukan SciPy dan IDE Spyder untuk OS Windows. (Diunduh dari www.python-xy.github.io/ )

Linux

Manajer paket dari masing-masing distribusi Linux digunakan untuk menginstal satu atau lebih paket dalam tumpukan SciPy.

Untuk Ubuntu

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

Untuk Fedora

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

Membangun dari Sumber

Core Python (2.6.x, 2.7.x dan 3.2.x dan seterusnya) harus diinstal dengan distutils dan modul zlib harus diaktifkan.

Kompiler GNU gcc (4.2 dan yang lebih baru) C harus tersedia.

Untuk menginstal NumPy, jalankan perintah berikut.

Python setup.py install

Mari kita uji apakah modul NumPy diinstal dengan benar, coba impor dari prompt Python.

Jika tidak diinstal, pesan kesalahan berikut akan ditampilkan.

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

Demikian pula, kita dapat memeriksa penginstalan semua paket Ilmu Data yang diperlukan yang ditampilkan di bab berikutnya.