Natural Language Toolkit - Başlarken
NLTK'yi kurmak için bilgisayarlarımızda Python kurulu olmalıdır. Www.python.org/downloads bağlantısına gidebilir ve işletim sisteminiz için en son sürümü, yani Windows, Mac ve Linux / Unix'i seçebilirsiniz. Python ile ilgili temel eğitim için www.tutorialspoint.com/python3/index.htm bağlantısına başvurabilirsiniz .
Şimdi, Python'u bilgisayar sisteminize yükledikten sonra, NLTK'yi nasıl kurabileceğimizi anlayalım.
NLTK kurulumu
NLTK'yi çeşitli işletim sistemlerine aşağıdaki gibi kurabiliriz -
Windows'ta
NLTK'yi Windows işletim sistemine kurmak için aşağıdaki adımları izleyin -
İlk olarak, Windows komut istemini açın ve uygulamanın konumuna gidin. pip Klasör.
Ardından, NLTK'yi yüklemek için aşağıdaki komutu girin -
pip3 install nltk
Şimdi, Windows Başlat Menüsünden PythonShell'i açın ve NLTK'nin kurulumunu doğrulamak için aşağıdaki komutu yazın -
Import nltk
Hata almazsanız, NLTK'yi Python3 içeren Windows işletim sisteminize başarıyla yüklediniz.
Mac / Linux'ta
NLTK'yi Mac / Linux OS üzerine kurmak için aşağıdaki komutu yazın -
sudo pip install -U nltk
Bilgisayarınızda pip kurulu değilse, ilk kurulum için aşağıda verilen talimatları izleyin. pip -
Öncelikle, aşağıdaki komutu kullanarak paket dizinini güncelleyin -
sudo apt update
Şimdi, yüklemek için aşağıdaki komutu yazın pip python 3 için -
sudo apt install python3-pip
Anaconda aracılığıyla
NLTK'yi Anaconda aracılığıyla kurmak için aşağıdaki adımları izleyin -
Öncelikle Anaconda'yı kurmak için www.anaconda.com/distribution/#download-section bağlantısına gidin ve ardından kurmanız gereken Python sürümünü seçin.
Anaconda'yı bilgisayar sisteminize yükledikten sonra, komut istemine gidin ve aşağıdaki komutu yazın -
conda install -c anaconda nltk
Çıktıyı gözden geçirmeniz ve 'evet' girmeniz gerekir. NLTK, Anaconda paketinize indirilecek ve yüklenecektir.
NLTK'nın Veri Kümesini ve Paketlerini İndirme
Şimdi bilgisayarlarımızda NLTK kurulu ancak onu kullanmak için içinde bulunan veri setlerini (korpus) indirmemiz gerekiyor. Mevcut önemli veri kümelerinden bazılarıstpwords, guntenberg, framenet_v15 ve bunun gibi.
Aşağıdaki komutların yardımıyla tüm NLTK veri setlerini indirebiliriz -
import nltk
nltk.download()
Aşağıdaki NLTK indirilen penceresini alacaksınız.
Şimdi, veri setlerini indirmek için indirme düğmesine tıklayın.
NLTK komut dosyası nasıl çalıştırılır?
Aşağıda, Porter Stemmer algoritmasını kullanarak uyguladığımız örnek yer almaktadır. PorterStemmernltk sınıfı. bu örnek ile NLTK komut dosyasının nasıl çalıştırılacağını anlayabileceksiniz.
İlk olarak, doğal dil araç setini (nltk) içe aktarmamız gerekiyor.
import nltk
Şimdi, PorterStemmer Porter Stemmer algoritmasını uygulamak için sınıf.
from nltk.stem import PorterStemmer
Ardından, aşağıdaki gibi bir Porter Stemmer sınıfı örneği oluşturun -
word_stemmer = PorterStemmer()
Şimdi, kökten çıkarmak istediğiniz kelimeyi girin. -
word_stemmer.stem('writing')
Çıktı
'write'
word_stemmer.stem('eating')
Çıktı
'eat'