Набор инструментов для естественного языка - начало работы

Чтобы установить NLTK, на наших компьютерах должен быть установлен Python. Вы можете перейти по ссылке www.python.org/downloads и выбрать последнюю версию для вашей ОС, то есть Windows, Mac и Linux / Unix. Базовое руководство по Python можно найти по ссылке www.tutorialspoint.com/python3/index.htm .

Теперь, когда у вас установлен Python в вашей компьютерной системе, позвольте нам понять, как мы можем установить NLTK.

Установка NLTK

Мы можем установить NLTK на различные ОС следующим образом:

В Windows

Чтобы установить NLTK в ОС Windows, выполните следующие действия:

  • Сначала откройте командную строку Windows и перейдите к расположению pip папка.

  • Затем введите следующую команду для установки NLTK -

pip3 install nltk

Теперь откройте PythonShell из меню «Пуск» Windows и введите следующую команду, чтобы проверить установку NLTK:

Import nltk

Если ошибки нет, значит, вы успешно установили NLTK в ОС Windows с Python3.

На Mac / Linux

Чтобы установить NLTK на Mac / Linux OS, напишите следующую команду -

sudo pip install -U nltk

Если на вашем компьютере не установлен pip, следуйте приведенным ниже инструкциям для первой установки. pip -

Сначала обновите индекс пакета, выполнив следующую команду -

sudo apt update

Теперь введите следующую команду для установки pip для Python 3 -

sudo apt install python3-pip

Через Анаконду

Чтобы установить NLTK через Anaconda, выполните следующие действия:

Сначала, чтобы установить Anaconda, перейдите по ссылке www.anaconda.com/distribution/#download-section, а затем выберите версию Python, которую необходимо установить.

Как только у вас будет Anaconda в вашей компьютерной системе, перейдите в ее командную строку и введите следующую команду:

conda install -c anaconda nltk

Вам необходимо просмотреть вывод и ввести «да». NLTK будет загружен и установлен в вашем пакете Anaconda.

Скачивание набора данных и пакетов NLTK

Теперь у нас есть NLTK, установленный на наших компьютерах, но для его использования нам необходимо загрузить доступные в нем наборы данных (корпус). Некоторые из важных доступных наборов данных:stpwords, guntenberg, framenet_v15 и так далее.

С помощью следующих команд мы можем загрузить все наборы данных NLTK -

import nltk
nltk.download()

Вы получите следующее окно загрузки NLTK.

Теперь нажмите кнопку загрузки, чтобы загрузить наборы данных.

Как запустить скрипт NLTK?

Ниже приведен пример, в котором мы реализуем алгоритм Портера Стеммера, используя PorterStemmerкласс nltk. на этом примере вы сможете понять, как запустить сценарий NLTK.

Во-первых, нам нужно импортировать инструментарий естественного языка (nltk).

import nltk

Теперь импортируйте PorterStemmer класс для реализации алгоритма Портера Стеммера.

from nltk.stem import PorterStemmer

Затем создайте экземпляр класса Porter Stemmer следующим образом:

word_stemmer = PorterStemmer()

Теперь введите слово, которое хотите остановить. -

word_stemmer.stem('writing')

Вывод

'write'
word_stemmer.stem('eating')

Вывод

'eat'