Natural LanguageToolkit-はじめに
NLTKをインストールするには、コンピューターにPythonをインストールする必要があります。リンクwww.python.org/downloadsにアクセスして、OSの最新バージョン(Windows、Mac、Linux / Unix)を選択できます。Pythonの基本的なチュートリアルについては、リンクwww.tutorialspoint.com/python3/index.htmを参照してください。
ここで、コンピューターシステムにPythonをインストールしたら、NLTKをインストールする方法を理解しましょう。
NLTKのインストール
NLTKは次のようにさまざまなOSにインストールできます-
Windowsの場合
Windows OSにNLTKをインストールするには、以下の手順に従ってください。
まず、Windowsコマンドプロンプトを開き、の場所に移動します pip フォルダ。
次に、次のコマンドを入力してNLTKをインストールします-
pip3 install nltk
ここで、WindowsのスタートメニューからPythonShellを開き、次のコマンドを入力して、NLTKのインストールを確認します-
Import nltk
エラーが発生しない場合は、Python3を搭載したWindowsOSにNLTKが正常にインストールされています。
Mac / Linuxの場合
Mac / Linux OSにNLTKをインストールするには、次のコマンドを記述します-
sudo pip install -U nltk
コンピューターにpipがインストールされていない場合は、以下の手順に従って最初にインストールしてください pip −
まず、次のコマンドを使用して、パッケージインデックスを更新します-
sudo apt update
次に、次のコマンドを入力してインストールします pip Python3の場合-
sudo apt install python3-pip
アナコンダを通して
Anacondaを介してNLTKをインストールするには、以下の手順に従います-
まず、Anacondaをインストールするには、リンクwww.anaconda.com/distribution/#download-sectionにアクセスし、インストールする必要のあるPythonのバージョンを選択します。
コンピューターシステムにAnacondaをインストールしたら、コマンドプロンプトに移動し、次のコマンドを記述します-
conda install -c anaconda nltk
出力を確認して、「yes」と入力する必要があります。NLTKがダウンロードされ、Anacondaパッケージにインストールされます。
NLTKのデータセットとパッケージのダウンロード
これで、NLTKがコンピューターにインストールされましたが、それを使用するには、NLTKで使用可能なデータセット(コーパス)をダウンロードする必要があります。利用可能な重要なデータセットのいくつかは次のとおりです。stpwords, guntenberg, framenet_v15 等々。
次のコマンドの助けを借りて、すべてのNLTKデータセットをダウンロードできます-
import nltk
nltk.download()
次のNLTKダウンロードウィンドウが表示されます。
次に、ダウンロードボタンをクリックして、データセットをダウンロードします。
NLTKスクリプトを実行する方法は?
以下は、PorterStemmerアルゴリズムを使用して実装している例です。 PorterStemmernltkクラス。この例を使用すると、NLTKスクリプトの実行方法を理解できます。
まず、自然言語ツールキット(nltk)をインポートする必要があります。
import nltk
今、インポートします PorterStemmer PorterStemmerアルゴリズムを実装するクラス。
from nltk.stem import PorterStemmer
次に、次のようにPorterStemmerクラスのインスタンスを作成します-
word_stemmer = PorterStemmer()
ここで、語幹にしたい単語を入力します。−
word_stemmer.stem('writing')
出力
'write'
word_stemmer.stem('eating')
出力
'eat'