Zestaw narzędzi języka naturalnego - wprowadzenie

Aby zainstalować NLTK, musimy mieć zainstalowany Python na naszych komputerach. Możesz przejść do łącza www.python.org/downloads i wybrać najnowszą wersję dla swojego systemu operacyjnego, tj. Windows, Mac i Linux / Unix. Aby zapoznać się z podstawowym samouczkiem na temat Pythona, możesz skorzystać z łącza www.tutorialspoint.com/python3/index.htm .

Po zainstalowaniu Pythona w systemie komputerowym, pozwól nam zrozumieć, jak możemy zainstalować NLTK.

Instalowanie NLTK

Możemy zainstalować NLTK w różnych systemach operacyjnych w następujący sposób -

W systemie Windows

Aby zainstalować NLTK w systemie operacyjnym Windows, wykonaj poniższe czynności -

  • Najpierw otwórz wiersz polecenia systemu Windows i przejdź do lokalizacji pliku pip teczka.

  • Następnie wprowadź następujące polecenie, aby zainstalować NLTK -

pip3 install nltk

Teraz otwórz PythonShell z menu Start systemu Windows i wpisz następujące polecenie, aby zweryfikować instalację NLTK -

Import nltk

Jeśli nie pojawi się żaden błąd, pomyślnie zainstalowałeś NLTK w swoim systemie operacyjnym Windows z Python3.

W systemie Mac / Linux

Aby zainstalować NLTK w systemie Mac / Linux OS, wpisz następujące polecenie -

sudo pip install -U nltk

Jeśli nie masz zainstalowanego pip na swoim komputerze, postępuj zgodnie z instrukcjami podanymi poniżej, aby najpierw zainstalować pip -

Najpierw zaktualizuj indeks pakietu, wykonując następujące polecenie -

sudo apt update

Teraz wpisz następujące polecenie, aby zainstalować pip dla Pythona 3 -

sudo apt install python3-pip

Przez Anacondę

Aby zainstalować NLTK przez Anacondę, wykonaj poniższe czynności -

Najpierw, aby zainstalować Anacondę , przejdź do linku www.anaconda.com/distribution/#download-section, a następnie wybierz wersję Pythona, którą chcesz zainstalować.

Po zainstalowaniu Anacondy w systemie komputerowym przejdź do wiersza poleceń i wpisz następujące polecenie -

conda install -c anaconda nltk

Musisz przejrzeć dane wyjściowe i wpisać „tak”. NLTK zostanie pobrane i zainstalowane w Twoim pakiecie Anaconda.

Pobieranie zestawu danych i pakietów NLTK

Teraz mamy zainstalowane NLTK na naszych komputerach, ale aby z niego korzystać musimy pobrać dostępne w nim zbiory danych (korpus). Niektóre z ważnych dostępnych zbiorów danych tostpwords, guntenberg, framenet_v15 i tak dalej.

Za pomocą następujących poleceń możemy pobrać wszystkie zestawy danych NLTK -

import nltk
nltk.download()

Otrzymasz następujące okno pobierania NLTK.

Teraz kliknij przycisk pobierania, aby pobrać zestawy danych.

Jak uruchomić skrypt NLTK?

Poniżej znajduje się przykład, w którym implementujemy algorytm Portera Stemmera przy użyciu PorterStemmerklasa nltk. na tym przykładzie byłbyś w stanie zrozumieć, jak uruchomić skrypt NLTK.

Najpierw musimy zaimportować zestaw narzędzi języka naturalnego (nltk).

import nltk

Teraz zaimportuj plik PorterStemmer do implementacji algorytmu Portera Stemmera.

from nltk.stem import PorterStemmer

Następnie utwórz instancję klasy Porter Stemmer w następujący sposób -

word_stemmer = PorterStemmer()

Teraz wprowadź słowo, które chcesz wywołać. -

word_stemmer.stem('writing')

Wynik

'write'
word_stemmer.stem('eating')

Wynik

'eat'