Python - Penyiapan Lingkungan Sains Data
Agar berhasil membuat dan menjalankan kode contoh dalam tutorial ini, kita memerlukan pengaturan lingkungan yang akan memiliki python untuk keperluan umum serta paket khusus yang diperlukan untuk ilmu Data. Pertama-tama kita akan melihat seperti menginstal python untuk keperluan umum yang dapat berupa python 2 atau python 3. Tetapi kami akan lebih memilih python 2 untuk tutorial ini terutama karena kematangannya dan dukungan yang lebih luas dari paket eksternal.
Mendapatkan Python
Kode sumber, binari, dokumentasi, berita, dll yang paling mutakhir dan terkini, tersedia di situs web resmi Python https://www.python.org/
Anda dapat mengunduh dokumentasi Python dari https://www.python.org/doc/. Dokumentasi tersedia dalam format HTML, PDF, dan PostScript.
Menginstal Python
Distribusi Python tersedia untuk berbagai macam platform. Anda hanya perlu mengunduh kode biner yang berlaku untuk platform Anda dan menginstal Python.
Jika kode biner untuk platform Anda tidak tersedia, Anda memerlukan compiler C untuk mengompilasi kode sumber secara manual. Mengompilasi kode sumber menawarkan lebih banyak fleksibilitas dalam hal pilihan fitur yang Anda perlukan dalam instalasi Anda.
Berikut ini gambaran umum singkat tentang menginstal Python di berbagai platform -
Instalasi Unix dan Linux
Berikut adalah langkah-langkah sederhana untuk menginstal Python di mesin Unix / Linux.
Buka browser web dan buka https://www.python.org/downloads/.
Ikuti tautan untuk mengunduh kode sumber zip yang tersedia untuk Unix / Linux.
Unduh dan ekstrak file.
Mengedit file Modules / Setup jika Anda ingin menyesuaikan beberapa opsi.
jalankan ./configure script
make
buat instal
Ini menginstal Python di lokasi standar / usr / local / bin dan perpustakaannya di / usr / local / lib / pythonXX di mana XX adalah versi Python.
Instalasi Windows
Berikut adalah langkah-langkah untuk menginstal Python di mesin Windows.
Buka browser web dan buka https://www.python.org/downloads/.
Ikuti tautan untuk file python-XYZ.msi penginstal Windows di mana XYZ adalah versi yang perlu Anda instal.
Untuk menggunakan installer python-XYZ.msi ini , sistem Windows harus mendukung Microsoft Installer 2.0. Simpan file pemasang ke komputer lokal Anda dan kemudian jalankan untuk mengetahui apakah mesin Anda mendukung MSI.
Jalankan file yang diunduh. Ini menampilkan wizard instalasi Python, yang sangat mudah digunakan. Cukup terima pengaturan default, tunggu hingga penginstalan selesai, dan Anda selesai.
Instalasi Macintosh
Mac terbaru dilengkapi dengan Python yang diinstal, tetapi mungkin sudah beberapa tahun kedaluwarsa. Lihathttp://www.python.org/download/mac/untuk instruksi tentang mendapatkan versi saat ini bersama dengan alat tambahan untuk mendukung pengembangan di Mac. Untuk Mac OS lama sebelum Mac OS X 10.3 (dirilis pada 2003), MacPython tersedia.
Jack Jansen memeliharanya dan Anda dapat memiliki akses penuh ke seluruh dokumentasi di situsnya - http://www.cwi.nl/~jack/macpython.html. Anda dapat menemukan detail penginstalan lengkap untuk penginstalan Mac OS.
Menyiapkan PATH
Program dan file yang dapat dijalankan lainnya dapat berada di banyak direktori, sehingga sistem operasi menyediakan jalur pencarian yang mencantumkan direktori yang dicari oleh OS untuk dapat dieksekusi.
Path disimpan dalam variabel lingkungan, yang merupakan string bernama yang dikelola oleh sistem operasi. Variabel ini berisi informasi yang tersedia untuk shell perintah dan program lain.
Itu path variabel dinamai sebagai PATH di Unix atau Path di Windows (Unix peka huruf besar / kecil; Windows tidak).
Di Mac OS, penginstal menangani detail jalur. Untuk memanggil interpreter Python dari direktori tertentu, Anda harus menambahkan direktori Python ke jalur Anda.
Setting path di Unix / Linux
Untuk menambahkan direktori Python ke jalur untuk sesi tertentu di Unix -
In the csh shell - ketik setenv PATH "$ PATH: / usr / local / bin / python" dan tekan Enter.
In the bash shell (Linux) - ketik export ATH = "$ PATH: / usr / local / bin / python" dan tekan Enter.
In the sh or ksh shell - ketik PATH = "$ PATH: / usr / local / bin / python" dan tekan Enter.
Note - / usr / local / bin / python adalah jalur direktori Python
Jalur pengaturan di Windows
Untuk menambahkan direktori Python ke jalur untuk sesi tertentu di Windows -
At the command prompt - ketik path% path%; C: \ Python dan tekan Enter.
Note - C: \ Python adalah jalur direktori Python
Variabel Lingkungan Python
Berikut adalah variabel lingkungan penting, yang dapat dikenali oleh Python -
Sr.No. | Variabel & Deskripsi |
---|---|
1 | PYTHONPATH Ini memiliki peran yang mirip dengan PATH. Variabel ini memberi tahu interpreter Python di mana menemukan file modul yang diimpor ke dalam program. Ini harus menyertakan direktori pustaka sumber Python dan direktori yang berisi kode sumber Python. PYTHONPATH terkadang sudah diatur sebelumnya oleh pemasang Python. |
2 | PYTHONSTARTUP Ini berisi jalur file inisialisasi yang berisi kode sumber Python. Ini dijalankan setiap kali Anda memulai penerjemah. Ini dinamai sebagai .pythonrc.py di Unix dan berisi perintah yang memuat utilitas atau memodifikasi PYTHONPATH. |
3 | PYTHONCASEOK Ini digunakan di Windows untuk menginstruksikan Python untuk menemukan kecocokan case-insensitive pertama dalam pernyataan import. Setel variabel ini ke nilai apa pun untuk mengaktifkannya. |
4 | PYTHONHOME Ini adalah jalur pencarian modul alternatif. Ini biasanya tertanam di direktori PYTHONSTARTUP atau PYTHONPATH untuk membuat pustaka modul beralih dengan mudah. |
Menjalankan Python
Ada tiga cara berbeda untuk memulai Python -
Penerjemah Interaktif
Anda dapat memulai Python dari Unix, DOS, atau sistem lain yang memberi Anda penafsir baris perintah atau jendela shell.
Memasukkan python baris perintah.
Mulai coding segera di interpreter interaktif.
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
Berikut adalah daftar semua opsi baris perintah yang tersedia -
Sr.No. | Opsi & Deskripsi |
---|---|
1 | -d Ini memberikan keluaran debug. |
2 | -O Ini menghasilkan bytecode yang dioptimalkan (menghasilkan file .pyo). |
3 | -S Jangan jalankan import situs untuk mencari jalur Python saat memulai. |
4 | -v keluaran verbose (jejak rinci pada pernyataan impor). |
5 | -X nonaktifkan pengecualian bawaan berbasis kelas (cukup gunakan string); usang dimulai dengan versi 1.6. |
6 | -c cmd jalankan skrip Python yang dikirim sebagai string cmd |
7 | file jalankan skrip Python dari file yang diberikan |
Script dari Command-line
Skrip Python dapat dijalankan pada baris perintah dengan memanggil interpreter pada aplikasi Anda, seperti berikut ini -
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - Pastikan mode izin file memungkinkan eksekusi.
Lingkungan Pembangunan Terpadu
Anda juga dapat menjalankan Python dari lingkungan Graphical User Interface (GUI), jika Anda memiliki aplikasi GUI di sistem Anda yang mendukung Python.
Unix - IDLE adalah IDE Unix pertama untuk Python.
Windows - PythonWin adalah antarmuka Windows pertama untuk Python dan merupakan IDE dengan GUI.
Macintosh - Versi Macintosh dari Python bersama dengan IDLE IDE tersedia dari situs web utama, dapat diunduh sebagai file MacBinary atau BinHex.
Menginstal SciPy Pack
Cara terbaik untuk mengaktifkan paket yang diperlukan adalah dengan menggunakan paket biner yang dapat diinstal khusus untuk sistem operasi Anda. Biner ini berisi tumpukan SciPy lengkap (termasuk paket NumPy, SciPy, matplotlib, IPython, SymPy dan nose bersama dengan inti Python).
Windows
Anaconda (dari www.continuum.io ) adalah distribusi Python gratis untuk tumpukan SciPy. Ini juga tersedia untuk Linux dan Mac.
Canopy ( www.enthought.com/products/canopy/ ) tersedia gratis serta distribusi komersial dengan tumpukan SciPy lengkap untuk Windows, Linux dan Mac.
Python (x, y): Ini adalah distribusi Python gratis dengan tumpukan SciPy dan IDE Spyder untuk OS Windows. (Diunduh dari www.python-xy.github.io/ )
Linux
Manajer paket dari masing-masing distribusi Linux digunakan untuk menginstal satu atau lebih paket dalam tumpukan SciPy.
Untuk Ubuntu
sudo apt-get install python-numpy
python-scipy python-matplotlibipythonipythonnotebook python-pandas
python-sympy python-nose
Untuk Fedora
sudo yum install numpyscipy python-matplotlibipython
python-pandas sympy python-nose atlas-devel
Membangun dari Sumber
Core Python (2.6.x, 2.7.x dan 3.2.x dan seterusnya) harus diinstal dengan distutils dan modul zlib harus diaktifkan.
Kompiler GNU gcc (4.2 dan yang lebih baru) C harus tersedia.
Untuk menginstal NumPy, jalankan perintah berikut.
Python setup.py install
Mari kita uji apakah modul NumPy diinstal dengan benar, coba impor dari prompt Python.
Jika tidak diinstal, pesan kesalahan berikut akan ditampilkan.
Traceback (most recent call last):
File "<pyshell#0>", line 1, in <module>
import numpy
ImportError: No module named 'numpy'
Demikian pula, kita dapat memeriksa penginstalan semua paket Ilmu Data yang diperlukan yang ditampilkan di bab berikutnya.