Perangkat Bahasa Alami - Memulai

Untuk menginstal NLTK, kita harus menginstal Python di komputer kita. Anda bisa pergi ke link www.python.org/downloads dan pilih versi terbaru untuk OS Anda yaitu Windows, Mac dan Linux / Unix. Untuk tutorial dasar tentang Python, Anda dapat merujuk ke tautan www.tutorialspoint.com/python3/index.htm .

Sekarang, setelah Anda menginstal Python di sistem komputer Anda, beri tahu kami bagaimana kami dapat menginstal NLTK.

Menginstal NLTK

Kami dapat menginstal NLTK di berbagai OS sebagai berikut -

Di Windows

Untuk menginstal NLTK di OS Windows, ikuti langkah-langkah di bawah ini -

  • Pertama, buka command prompt Windows dan arahkan ke lokasi file pip map.

  • Selanjutnya, masukkan perintah berikut untuk menginstal NLTK -

pip3 install nltk

Sekarang, buka PythonShell dari Start Menu Windows dan ketik perintah berikut untuk memverifikasi instalasi NLTK -

Import nltk

Jika Anda tidak mendapatkan kesalahan, Anda telah berhasil menginstal NLTK di OS Windows Anda yang memiliki Python3.

Di Mac / Linux

Untuk menginstal NLTK di Mac / Linux OS, tulis perintah berikut -

sudo pip install -U nltk

Jika Anda belum menginstal pip di komputer Anda, ikuti instruksi yang diberikan di bawah ini untuk menginstal pertama pip -

Pertama, perbarui indeks paket dengan mengikuti menggunakan perintah berikut -

sudo apt update

Sekarang, ketik perintah berikut untuk menginstal pip untuk python 3 -

sudo apt install python3-pip

Melalui Anaconda

Untuk menginstal NLTK melalui Anaconda, ikuti langkah-langkah di bawah ini -

Pertama, untuk menginstal Anaconda, buka link www.anaconda.com/distribution/#download-section lalu pilih versi Python yang perlu diinstal.

Setelah Anda memiliki Anaconda di sistem komputer Anda, buka prompt perintahnya dan tulis perintah berikut -

conda install -c anaconda nltk

Anda perlu meninjau hasilnya dan memasukkan 'ya'. NLTK akan diunduh dan diinstal dalam paket Anaconda Anda.

Mengunduh Set Data dan Paket NLTK

Sekarang kami telah menginstal NLTK di komputer kami tetapi untuk menggunakannya kami perlu mengunduh kumpulan data (korpus) yang tersedia di dalamnya. Beberapa set data penting yang tersedia adalahstpwords, guntenberg, framenet_v15 dan seterusnya.

Dengan bantuan perintah berikut, kami dapat mengunduh semua kumpulan data NLTK -

import nltk
nltk.download()

Anda akan mendapatkan jendela unduhan NLTK berikut.

Sekarang, klik tombol unduh untuk mengunduh kumpulan data.

Bagaimana cara menjalankan skrip NLTK?

Berikut contoh implementasi algoritma Porter Stemmer dengan menggunakan PorterStemmerkelas nltk. dengan contoh ini Anda akan dapat memahami cara menjalankan skrip NLTK.

Pertama, kita perlu mengimpor toolkit bahasa alami (nltk).

import nltk

Sekarang, impor file PorterStemmer kelas untuk mengimplementasikan algoritma Porter Stemmer.

from nltk.stem import PorterStemmer

Selanjutnya, buat instance kelas Porter Stemmer sebagai berikut -

word_stemmer = PorterStemmer()

Sekarang, masukkan kata yang ingin Anda batang. -

word_stemmer.stem('writing')

Keluaran

'write'
word_stemmer.stem('eating')

Keluaran

'eat'