Natural Language Toolkit - Başlarken

NLTK'yi kurmak için bilgisayarlarımızda Python kurulu olmalıdır. Www.python.org/downloads bağlantısına gidebilir ve işletim sisteminiz için en son sürümü, yani Windows, Mac ve Linux / Unix'i seçebilirsiniz. Python ile ilgili temel eğitim için www.tutorialspoint.com/python3/index.htm bağlantısına başvurabilirsiniz .

Şimdi, Python'u bilgisayar sisteminize yükledikten sonra, NLTK'yi nasıl kurabileceğimizi anlayalım.

NLTK kurulumu

NLTK'yi çeşitli işletim sistemlerine aşağıdaki gibi kurabiliriz -

Windows'ta

NLTK'yi Windows işletim sistemine kurmak için aşağıdaki adımları izleyin -

  • İlk olarak, Windows komut istemini açın ve uygulamanın konumuna gidin. pip Klasör.

  • Ardından, NLTK'yi yüklemek için aşağıdaki komutu girin -

pip3 install nltk

Şimdi, Windows Başlat Menüsünden PythonShell'i açın ve NLTK'nin kurulumunu doğrulamak için aşağıdaki komutu yazın -

Import nltk

Hata almazsanız, NLTK'yi Python3 içeren Windows işletim sisteminize başarıyla yüklediniz.

Mac / Linux'ta

NLTK'yi Mac / Linux OS üzerine kurmak için aşağıdaki komutu yazın -

sudo pip install -U nltk

Bilgisayarınızda pip kurulu değilse, ilk kurulum için aşağıda verilen talimatları izleyin. pip -

Öncelikle, aşağıdaki komutu kullanarak paket dizinini güncelleyin -

sudo apt update

Şimdi, yüklemek için aşağıdaki komutu yazın pip python 3 için -

sudo apt install python3-pip

Anaconda aracılığıyla

NLTK'yi Anaconda aracılığıyla kurmak için aşağıdaki adımları izleyin -

Öncelikle Anaconda'yı kurmak için www.anaconda.com/distribution/#download-section bağlantısına gidin ve ardından kurmanız gereken Python sürümünü seçin.

Anaconda'yı bilgisayar sisteminize yükledikten sonra, komut istemine gidin ve aşağıdaki komutu yazın -

conda install -c anaconda nltk

Çıktıyı gözden geçirmeniz ve 'evet' girmeniz gerekir. NLTK, Anaconda paketinize indirilecek ve yüklenecektir.

NLTK'nın Veri Kümesini ve Paketlerini İndirme

Şimdi bilgisayarlarımızda NLTK kurulu ancak onu kullanmak için içinde bulunan veri setlerini (korpus) indirmemiz gerekiyor. Mevcut önemli veri kümelerinden bazılarıstpwords, guntenberg, framenet_v15 ve bunun gibi.

Aşağıdaki komutların yardımıyla tüm NLTK veri setlerini indirebiliriz -

import nltk
nltk.download()

Aşağıdaki NLTK indirilen penceresini alacaksınız.

Şimdi, veri setlerini indirmek için indirme düğmesine tıklayın.

NLTK komut dosyası nasıl çalıştırılır?

Aşağıda, Porter Stemmer algoritmasını kullanarak uyguladığımız örnek yer almaktadır. PorterStemmernltk sınıfı. bu örnek ile NLTK komut dosyasının nasıl çalıştırılacağını anlayabileceksiniz.

İlk olarak, doğal dil araç setini (nltk) içe aktarmamız gerekiyor.

import nltk

Şimdi, PorterStemmer Porter Stemmer algoritmasını uygulamak için sınıf.

from nltk.stem import PorterStemmer

Ardından, aşağıdaki gibi bir Porter Stemmer sınıfı örneği oluşturun -

word_stemmer = PorterStemmer()

Şimdi, kökten çıkarmak istediğiniz kelimeyi girin. -

word_stemmer.stem('writing')

Çıktı

'write'
word_stemmer.stem('eating')

Çıktı

'eat'