Набор инструментов для естественного языка - начало работы
Чтобы установить NLTK, на наших компьютерах должен быть установлен Python. Вы можете перейти по ссылке www.python.org/downloads и выбрать последнюю версию для вашей ОС, то есть Windows, Mac и Linux / Unix. Базовое руководство по Python можно найти по ссылке www.tutorialspoint.com/python3/index.htm .
Теперь, когда у вас установлен Python в вашей компьютерной системе, позвольте нам понять, как мы можем установить NLTK.
Установка NLTK
Мы можем установить NLTK на различные ОС следующим образом:
В Windows
Чтобы установить NLTK в ОС Windows, выполните следующие действия:
Сначала откройте командную строку Windows и перейдите к расположению pip папка.
Затем введите следующую команду для установки NLTK -
pip3 install nltk
Теперь откройте PythonShell из меню «Пуск» Windows и введите следующую команду, чтобы проверить установку NLTK:
Import nltk
Если ошибки нет, значит, вы успешно установили NLTK в ОС Windows с Python3.
На Mac / Linux
Чтобы установить NLTK на Mac / Linux OS, напишите следующую команду -
sudo pip install -U nltk
Если на вашем компьютере не установлен pip, следуйте приведенным ниже инструкциям для первой установки. pip -
Сначала обновите индекс пакета, выполнив следующую команду -
sudo apt update
Теперь введите следующую команду для установки pip для Python 3 -
sudo apt install python3-pip
Через Анаконду
Чтобы установить NLTK через Anaconda, выполните следующие действия:
Сначала, чтобы установить Anaconda, перейдите по ссылке www.anaconda.com/distribution/#download-section, а затем выберите версию Python, которую необходимо установить.
Как только у вас будет Anaconda в вашей компьютерной системе, перейдите в ее командную строку и введите следующую команду:
conda install -c anaconda nltk
Вам необходимо просмотреть вывод и ввести «да». NLTK будет загружен и установлен в вашем пакете Anaconda.
Скачивание набора данных и пакетов NLTK
Теперь у нас есть NLTK, установленный на наших компьютерах, но для его использования нам необходимо загрузить доступные в нем наборы данных (корпус). Некоторые из важных доступных наборов данных:stpwords, guntenberg, framenet_v15 и так далее.
С помощью следующих команд мы можем загрузить все наборы данных NLTK -
import nltk
nltk.download()
Вы получите следующее окно загрузки NLTK.
Теперь нажмите кнопку загрузки, чтобы загрузить наборы данных.
Как запустить скрипт NLTK?
Ниже приведен пример, в котором мы реализуем алгоритм Портера Стеммера, используя PorterStemmerкласс nltk. на этом примере вы сможете понять, как запустить сценарий NLTK.
Во-первых, нам нужно импортировать инструментарий естественного языка (nltk).
import nltk
Теперь импортируйте PorterStemmer класс для реализации алгоритма Портера Стеммера.
from nltk.stem import PorterStemmer
Затем создайте экземпляр класса Porter Stemmer следующим образом:
word_stemmer = PorterStemmer()
Теперь введите слово, которое хотите остановить. -
word_stemmer.stem('writing')
Вывод
'write'
word_stemmer.stem('eating')
Вывод
'eat'