Python-データサイエンス環境のセットアップ

このチュートリアルのサンプルコードを正常に作成して実行するには、汎用Pythonとデータサイエンスに必要な特別なパッケージの両方を備えた環境をセットアップする必要があります。最初は、python2またはpython3の汎用pythonをインストールするように見えますが、このチュートリアルでは、主に成熟度と外部パッケージの幅広いサポートのためにpython2を使用します。

Pythonの入手

最新かつ最新のソースコード、バイナリ、ドキュメント、ニュースなどは、Pythonの公式Webサイトで入手できます。 https://www.python.org/

Pythonのドキュメントはからダウンロードできます https://www.python.org/doc/。ドキュメントは、HTML、PDF、およびPostScript形式で入手できます。

Pythonのインストール

Pythonディストリビューションは、さまざまなプラットフォームで利用できます。プラットフォームに適用可能なバイナリコードのみをダウンロードして、Pythonをインストールする必要があります。

プラットフォームのバイナリコードが利用できない場合は、ソースコードを手動でコンパイルするためにCコンパイラが必要です。ソースコードをコンパイルすると、インストールに必要な機能の選択に関してより柔軟になります。

さまざまなプラットフォームへのPythonのインストールの概要は次のとおりです-

UnixおよびLinuxのインストール

Unix / LinuxマシンにPythonをインストールする簡単な手順は次のとおりです。

  • Webブラウザーを開き、 https://www.python.org/downloads/。

  • リンクをたどって、Unix / Linuxで利用可能なzip形式のソースコードをダウンロードします。

  • ファイルをダウンロードして抽出します。

  • 一部のオプションをカスタマイズする場合は、モジュール/セットアップファイルを編集します。

  • ./configureスクリプトを実行します

  • make

  • インストールする

これにより、Pythonが標準の場所/ usr / local / binにインストールされ、そのライブラリが/ usr / local / lib / pythonXXにインストールされます。XXはPythonのバージョンです。

Windowsのインストール

WindowsマシンにPythonをインストールする手順は次のとおりです。

  • Webブラウザーを開き、 https://www.python.org/downloads/。

  • XYZがインストールする必要のあるバージョンであるWindowsインストーラーpython-XYZ.msiファイルのリンクをたどります。

  • このインストーラーpython-XYZ.msiを使用するには、WindowsシステムがMicrosoftインストーラー2.0をサポートしている必要があります。インストーラーファイルをローカルマシンに保存してから実行し、マシンがMSIをサポートしているかどうかを確認します。

  • ダウンロードしたファイルを実行します。これにより、Pythonインストールウィザードが表示されます。これは非常に使いやすいです。デフォルト設定を受け入れ、インストールが完了するまで待つだけで完了です。

Macintoshのインストール

最近のMacにはPythonがインストールされていますが、数年前のものである可能性があります。見るhttp://www.python.org/download/mac/Macでの開発をサポートするための追加のツールとともに、現在のバージョンを入手する手順については。Mac OS X 10.3(2003年にリリース)より前の古いMac OSの場合、MacPythonを使用できます。

Jack Jansenがそれを維持しており、彼のWebサイトでドキュメント全体に完全にアクセスできます- http://www.cwi.nl/~jack/macpython.html。MacOSインストールの完全なインストールの詳細を見つけることができます。

PATHの設定

プログラムやその他の実行可能ファイルは多くのディレクトリに存在する可能性があるため、オペレーティングシステムは、OSが実行可能ファイルを検索するディレクトリを一覧表示する検索パスを提供します。

パスは、オペレーティングシステムによって維持される名前付き文字列である環境変数に格納されます。この変数には、コマンドシェルやその他のプログラムで利用できる情報が含まれています。

ザ・ path 変数の名前は、UnixではPATH、WindowsではPathです(Unixでは大文字と小文字が区別されますが、Windowsでは区別されません)。

Mac OSでは、インストーラーがパスの詳細を処理します。特定のディレクトリからPythonインタプリタを呼び出すには、Pythonディレクトリをパスに追加する必要があります。

Unix / Linuxでのパスの設定

Unixの特定のセッションのパスにPythonディレクトリを追加するには-

  • In the csh shell − setenv PATH "$ PATH:/ usr / local / bin / python"と入力し、Enterキーを押します。

  • In the bash shell (Linux) − export ATH = "$ PATH:/ usr / local / bin / python"と入力し、Enterキーを押します。

  • In the sh or ksh shell − PATH = "$ PATH:/ usr / local / bin / python"と入力し、Enterキーを押します。

  • Note − / usr / local / bin / pythonはPythonディレクトリのパスです

Windowsでパスを設定する

Windowsの特定のセッションのパスにPythonディレクトリを追加するには-

At the command prompt − path%path%; C:\ Pythonと入力し、Enterキーを押します。

Note − c:\ PythonはPythonディレクトリのパスです

Python環境変数

Pythonで認識できる重要な環境変数は次のとおりです-

シニア番号 変数と説明
1

PYTHONPATH

PATHと同様の役割があります。この変数は、プログラムにインポートされたモジュールファイルの場所をPythonインタープリターに指示します。PythonソースライブラリディレクトリとPythonソースコードを含むディレクトリを含める必要があります。PYTHONPATHは、Pythonインストーラーによって事前設定される場合があります。

2

PYTHONSTARTUP

Pythonソースコードを含む初期化ファイルのパスが含まれています。インタプリタを起動するたびに実行されます。Unixでは.pythonrc.pyという名前で、ユーティリティをロードしたり、PYTHONPATHを変更したりするコマンドが含まれています。

3

PYTHONCASEOK

これはWindowsで使用され、インポートステートメントで大文字と小文字を区別しない最初の一致を見つけるようにPythonに指示します。この変数を任意の値に設定してアクティブにします。

4

PYTHONHOME

これは、代替モジュール検索パスです。通常、モジュールライブラリの切り替えを容易にするために、PYTHONSTARTUPまたはPYTHONPATHディレクトリに埋め込まれています。

Pythonの実行

Pythonを起動するには3つの異なる方法があります-

インタラクティブ通訳

Pythonは、Unix、DOS、またはコマンドラインインタープリターまたはシェルウィンドウを提供するその他のシステムから起動できます。

入る python コマンドライン。

インタラクティブインタプリタですぐにコーディングを開始します。

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

使用可能なすべてのコマンドラインオプションのリストは次のとおりです-

シニア番号 オプションと説明
1

-d

デバッグ出力を提供します。

2

-O

最適化されたバイトコードを生成します(結果として.pyoファイルになります)。

3

-S

起動時にPythonパスを探すためにインポートサイトを実行しないでください。

4

-v

詳細な出力(インポートステートメントの詳細なトレース)。

5

-X

クラスベースの組み込み例外を無効にします(文字列を使用するだけです)。バージョン1.6以降は廃止されました。

6

-c cmd

cmd文字列として送信されたPythonスクリプトを実行します

7

file

指定されたファイルからPythonスクリプトを実行します

コマンドラインからのスクリプト

Pythonスクリプトは、次のように、アプリケーションでインタープリターを呼び出すことにより、コマンドラインで実行できます。

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

Note −ファイル許可モードで実行が許可されていることを確認してください。

統合開発環境

システムにPythonをサポートするGUIアプリケーションがある場合は、グラフィカルユーザーインターフェイス(GUI)環境からPythonを実行することもできます。

  • Unix − IDLEは、Python用の最初のUnixIDEです。

  • Windows − PythonWinは、Python用の最初のWindowsインターフェイスであり、GUIを備えたIDEです。

  • Macintosh −MacintoshバージョンのPythonとIDLEIDEは、メインのWebサイトから入手でき、MacBinaryファイルまたはBinHexファイルとしてダウンロードできます。

SciPyパックのインストール

必要なパックを有効にする最良の方法は、オペレーティングシステムに固有のインストール可能なバイナリパッケージを使用することです。これらのバイナリには、完全なSciPyスタック(NumPy、SciPy、matplotlib、IPython、SymPy、およびnoseパッケージとコアPythonを含む)が含まれています。

ウィンドウズ

Anaconda(www.continuum.ioから)は、SciPyスタック用の無料のPythonディストリビューションです。LinuxとMacでも利用できます。

Canopy(www.enthought.com/products/canopy/)は、Windows、Linux、およびMac用の完全なSciPyスタックを備えた無料および商用配布として利用できます。

Python(x、y):これはSciPyスタックとWindowsOS用のSpyderIDEを備えた無料のPythonディストリビューションです。(www.python-xy.github.io/からダウンロード可能)

Linux

それぞれのLinuxディストリビューションのパッケージマネージャーは、SciPyスタックに1つ以上のパッケージをインストールするために使用されます。

Ubuntuの場合

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

Fedoraの場合

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

ソースからの構築

Core Python(2.6.x、2.7.x、および3.2.x以降)はdistutilsとともにインストールする必要があり、zlibモジュールを有効にする必要があります。

GNU gcc(4.2以降)Cコンパイラが使用可能である必要があります。

NumPyをインストールするには、次のコマンドを実行します。

Python setup.py install

NumPyモジュールが正しくインストールされているかどうかをテストして、Pythonプロンプトからインポートしてみましょう。

インストールされていない場合、以下のエラーメッセージが表示されます。

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

同様に、次の章で示す必要なすべてのデータサイエンスパッケージのインストールを確認できます。