Zestaw narzędzi języka naturalnego - wprowadzenie
Aby zainstalować NLTK, musimy mieć zainstalowany Python na naszych komputerach. Możesz przejść do łącza www.python.org/downloads i wybrać najnowszą wersję dla swojego systemu operacyjnego, tj. Windows, Mac i Linux / Unix. Aby zapoznać się z podstawowym samouczkiem na temat Pythona, możesz skorzystać z łącza www.tutorialspoint.com/python3/index.htm .
Po zainstalowaniu Pythona w systemie komputerowym, pozwól nam zrozumieć, jak możemy zainstalować NLTK.
Instalowanie NLTK
Możemy zainstalować NLTK w różnych systemach operacyjnych w następujący sposób -
W systemie Windows
Aby zainstalować NLTK w systemie operacyjnym Windows, wykonaj poniższe czynności -
Najpierw otwórz wiersz polecenia systemu Windows i przejdź do lokalizacji pliku pip teczka.
Następnie wprowadź następujące polecenie, aby zainstalować NLTK -
pip3 install nltk
Teraz otwórz PythonShell z menu Start systemu Windows i wpisz następujące polecenie, aby zweryfikować instalację NLTK -
Import nltk
Jeśli nie pojawi się żaden błąd, pomyślnie zainstalowałeś NLTK w swoim systemie operacyjnym Windows z Python3.
W systemie Mac / Linux
Aby zainstalować NLTK w systemie Mac / Linux OS, wpisz następujące polecenie -
sudo pip install -U nltk
Jeśli nie masz zainstalowanego pip na swoim komputerze, postępuj zgodnie z instrukcjami podanymi poniżej, aby najpierw zainstalować pip -
Najpierw zaktualizuj indeks pakietu, wykonując następujące polecenie -
sudo apt update
Teraz wpisz następujące polecenie, aby zainstalować pip dla Pythona 3 -
sudo apt install python3-pip
Przez Anacondę
Aby zainstalować NLTK przez Anacondę, wykonaj poniższe czynności -
Najpierw, aby zainstalować Anacondę , przejdź do linku www.anaconda.com/distribution/#download-section, a następnie wybierz wersję Pythona, którą chcesz zainstalować.
Po zainstalowaniu Anacondy w systemie komputerowym przejdź do wiersza poleceń i wpisz następujące polecenie -
conda install -c anaconda nltk
Musisz przejrzeć dane wyjściowe i wpisać „tak”. NLTK zostanie pobrane i zainstalowane w Twoim pakiecie Anaconda.
Pobieranie zestawu danych i pakietów NLTK
Teraz mamy zainstalowane NLTK na naszych komputerach, ale aby z niego korzystać musimy pobrać dostępne w nim zbiory danych (korpus). Niektóre z ważnych dostępnych zbiorów danych tostpwords, guntenberg, framenet_v15 i tak dalej.
Za pomocą następujących poleceń możemy pobrać wszystkie zestawy danych NLTK -
import nltk
nltk.download()
Otrzymasz następujące okno pobierania NLTK.
Teraz kliknij przycisk pobierania, aby pobrać zestawy danych.
Jak uruchomić skrypt NLTK?
Poniżej znajduje się przykład, w którym implementujemy algorytm Portera Stemmera przy użyciu PorterStemmerklasa nltk. na tym przykładzie byłbyś w stanie zrozumieć, jak uruchomić skrypt NLTK.
Najpierw musimy zaimportować zestaw narzędzi języka naturalnego (nltk).
import nltk
Teraz zaimportuj plik PorterStemmer do implementacji algorytmu Portera Stemmera.
from nltk.stem import PorterStemmer
Następnie utwórz instancję klasy Porter Stemmer w następujący sposób -
word_stemmer = PorterStemmer()
Teraz wprowadź słowo, które chcesz wywołać. -
word_stemmer.stem('writing')
Wynik
'write'
word_stemmer.stem('eating')
Wynik
'eat'