Natural Language Toolkit - Primeiros passos
Para instalar o NLTK, devemos ter o Python instalado em nossos computadores. Você pode acessar o link www.python.org/downloads e selecionar a versão mais recente para o seu sistema operacional, ou seja, Windows, Mac e Linux / Unix. Para o tutorial básico sobre Python, você pode consultar o link www.tutorialspoint.com/python3/index.htm .
Agora, depois de instalar o Python em seu sistema de computador, vamos entender como podemos instalar o NLTK.
Instalando NLTK
Podemos instalar o NLTK em vários sistemas operacionais da seguinte maneira -
No Windows
Para instalar o NLTK no sistema operacional Windows, siga as etapas abaixo -
Primeiro, abra o prompt de comando do Windows e navegue até o local do pip pasta.
Em seguida, digite o seguinte comando para instalar o NLTK -
pip3 install nltk
Agora, abra o PythonShell no menu Iniciar do Windows e digite o seguinte comando para verificar a instalação do NLTK -
Import nltk
Se não obtiver nenhum erro, você instalou com sucesso o NLTK em seu sistema operacional Windows com Python3.
No Mac / Linux
Para instalar o NLTK no Mac / Linux OS, escreva o seguinte comando -
sudo pip install -U nltk
Se você não tem o pip instalado no seu computador, siga as instruções fornecidas abaixo para instalar primeiro pip -
Primeiro, atualize o índice do pacote seguindo o seguinte comando -
sudo apt update
Agora, digite o seguinte comando para instalar pip para python 3 -
sudo apt install python3-pip
Através da Anaconda
Para instalar o NLTK através do Anaconda, siga os passos abaixo -
Primeiro, para instalar o Anaconda, vá para o link www.anaconda.com/distribution/#download-section e selecione a versão do Python que você precisa instalar.
Depois de ter o Anaconda em seu sistema de computador, vá para o prompt de comando e escreva o seguinte comando -
conda install -c anaconda nltk
Você precisa revisar a saída e inserir 'sim'. O NLTK será baixado e instalado em seu pacote Anaconda.
Baixando o conjunto de dados e pacotes da NLTK
Agora temos o NLTK instalado em nossos computadores, mas para usá-lo precisamos baixar os conjuntos de dados (corpus) disponíveis nele. Alguns dos conjuntos de dados importantes disponíveis sãostpwords, guntenberg, framenet_v15 e assim por diante.
Com a ajuda dos comandos a seguir, podemos baixar todos os conjuntos de dados NLTK -
import nltk
nltk.download()
Você obterá a seguinte janela de download do NLTK.
Agora, clique no botão de download para baixar os conjuntos de dados.
Como executar o script NLTK?
A seguir está o exemplo em que estamos implementando o algoritmo Porter Stemmer usando PorterStemmerclasse nltk. com este exemplo, você seria capaz de entender como executar o script NLTK.
Primeiro, precisamos importar o kit de ferramentas de linguagem natural (nltk).
import nltk
Agora, importe o PorterStemmer classe para implementar o algoritmo Porter Stemmer.
from nltk.stem import PorterStemmer
Em seguida, crie uma instância da classe Porter Stemmer da seguinte maneira -
word_stemmer = PorterStemmer()
Agora, insira a palavra que você deseja radicalizar. -
word_stemmer.stem('writing')
Resultado
'write'
word_stemmer.stem('eating')
Resultado
'eat'