Natural LanguageToolkit-はじめに

NLTKをインストールするには、コンピューターにPythonをインストールする必要があります。リンクwww.python.org/downloadsにアクセスして、OSの最新バージョン(Windows、Mac、Linux / Unix)を選択できます。Pythonの基本的なチュートリアルについては、リンクwww.tutorialspoint.com/python3/index.htmを参照してください。

ここで、コンピューターシステムにPythonをインストールしたら、NLTKをインストールする方法を理解しましょう。

NLTKのインストール

NLTKは次のようにさまざまなOSにインストールできます-

Windowsの場合

Windows OSにNLTKをインストールするには、以下の手順に従ってください。

  • まず、Windowsコマンドプロンプトを開き、の場所に移動します pip フォルダ。

  • 次に、次のコマンドを入力してNLTKをインストールします-

pip3 install nltk

ここで、WindowsのスタートメニューからPythonShellを開き、次のコマンドを入力して、NLTKのインストールを確認します-

Import nltk

エラーが発生しない場合は、Python3を搭載したWindowsOSにNLTKが正常にインストールされています。

Mac / Linuxの場合

Mac / Linux OSにNLTKをインストールするには、次のコマンドを記述します-

sudo pip install -U nltk

コンピューターにpipがインストールされていない場合は、以下の手順に従って最初にインストールしてください pip

まず、次のコマンドを使用して、パッケージインデックスを更新します-

sudo apt update

次に、次のコマンドを入力してインストールします pip Python3の場合-

sudo apt install python3-pip

アナコンダを通して

Anacondaを介してNLTKをインストールするには、以下の手順に従います-

まず、Anacondaをインストールするには、リンクwww.anaconda.com/distribution/#download-sectionにアクセスし、インストールする必要のあるPythonのバージョンを選択します。

コンピューターシステムにAnacondaをインストールしたら、コマンドプロンプトに移動し、次のコマンドを記述します-

conda install -c anaconda nltk

出力を確認して、「yes」と入力する必要があります。NLTKがダウンロードされ、Anacondaパッケージにインストールされます。

NLTKのデータセットとパッケージのダウンロード

これで、NLTKがコンピューターにインストールされましたが、それを使用するには、NLTKで使用可能なデータセット(コーパス)をダウンロードする必要があります。利用可能な重要なデータセットのいくつかは次のとおりです。stpwords, guntenberg, framenet_v15 等々。

次のコマンドの助けを借りて、すべてのNLTKデータセットをダウンロードできます-

import nltk
nltk.download()

次のNLTKダウンロードウィンドウが表示されます。

次に、ダウンロードボタンをクリックして、データセットをダウンロードします。

NLTKスクリプトを実行する方法は?

以下は、PorterStemmerアルゴリズムを使用して実装している例です。 PorterStemmernltkクラス。この例を使用すると、NLTKスクリプトの実行方法を理解できます。

まず、自然言語ツールキット(nltk)をインポートする必要があります。

import nltk

今、インポートします PorterStemmer PorterStemmerアルゴリズムを実装するクラス。

from nltk.stem import PorterStemmer

次に、次のようにPorterStemmerクラスのインスタンスを作成します-

word_stemmer = PorterStemmer()

ここで、語幹にしたい単語を入力します。−

word_stemmer.stem('writing')

出力

'write'
word_stemmer.stem('eating')

出力

'eat'