Natural Language Toolkit - Erste Schritte

Um NLTK installieren zu können, muss Python auf unseren Computern installiert sein. Sie können unter dem Link www.python.org/downloads die neueste Version für Ihr Betriebssystem auswählen, z. B. Windows, Mac und Linux / Unix. Ein grundlegendes Tutorial zu Python finden Sie unter dem Link www.tutorialspoint.com/python3/index.htm .

Sobald Sie Python auf Ihrem Computersystem installiert haben, lassen Sie uns verstehen, wie wir NLTK installieren können.

NLTK installieren

Wir können NLTK auf verschiedenen Betriebssystemen wie folgt installieren:

Unter Windows

Führen Sie die folgenden Schritte aus, um NLTK unter Windows zu installieren:

  • Öffnen Sie zunächst die Windows-Eingabeaufforderung und navigieren Sie zum Speicherort des pip Mappe.

  • Geben Sie als Nächstes den folgenden Befehl ein, um NLTK zu installieren:

pip3 install nltk

Öffnen Sie nun die PythonShell über das Windows-Startmenü und geben Sie den folgenden Befehl ein, um die Installation von NLTK zu überprüfen:

Import nltk

Wenn Sie keine Fehlermeldung erhalten, haben Sie NLTK erfolgreich auf Ihrem Windows-Betriebssystem mit Python3 installiert.

Unter Mac / Linux

Schreiben Sie den folgenden Befehl, um NLTK unter Mac / Linux zu installieren:

sudo pip install -U nltk

Wenn Sie Pip nicht auf Ihrem Computer installiert haben, befolgen Sie die folgenden Anweisungen, um es zuerst zu installieren pip - -

Aktualisieren Sie zunächst den Paketindex, indem Sie den folgenden Befehl ausführen:

sudo apt update

Geben Sie nun den folgenden zu installierenden Befehl ein pip für Python 3 -

sudo apt install python3-pip

Durch Anaconda

Führen Sie die folgenden Schritte aus, um NLTK über Anaconda zu installieren:

Um Anaconda zu installieren, rufen Sie zunächst den Link www.anaconda.com/distribution/#download-section auf und wählen Sie dann die Version von Python aus, die Sie installieren möchten .

Wenn Sie Anaconda auf Ihrem Computersystem installiert haben, rufen Sie die Eingabeaufforderung auf und schreiben Sie den folgenden Befehl:

conda install -c anaconda nltk

Sie müssen die Ausgabe überprüfen und "Ja" eingeben. NLTK wird heruntergeladen und in Ihrem Anaconda-Paket installiert.

Herunterladen des NLTK-Datensatzes und der Pakete

Jetzt haben wir NLTK auf unseren Computern installiert, aber um es zu verwenden, müssen wir die darin verfügbaren Datensätze (Korpus) herunterladen. Einige der wichtigsten verfügbaren Datensätze sindstpwords, guntenberg, framenet_v15 und so weiter.

Mit Hilfe der folgenden Befehle können wir alle NLTK-Datensätze herunterladen -

import nltk
nltk.download()

Sie erhalten das folgende heruntergeladene NLTK-Fenster.

Klicken Sie nun auf den Download-Button, um die Datensätze herunterzuladen.

Wie führe ich ein NLTK-Skript aus?

Es folgt das Beispiel, in dem wir den Porter Stemmer-Algorithmus mithilfe von implementieren PorterStemmernltk Klasse. Mit diesem Beispiel können Sie verstehen, wie ein NLTK-Skript ausgeführt wird.

Zuerst müssen wir das Toolkit für natürliche Sprache (nltk) importieren.

import nltk

Importieren Sie nun die PorterStemmer Klasse zur Implementierung des Porter Stemmer-Algorithmus.

from nltk.stem import PorterStemmer

Erstellen Sie als Nächstes eine Instanz der Porter Stemmer-Klasse wie folgt:

word_stemmer = PorterStemmer()

Geben Sie nun das Wort ein, das Sie verwenden möchten. - -

word_stemmer.stem('writing')

Ausgabe

'write'
word_stemmer.stem('eating')

Ausgabe

'eat'