ชุดเครื่องมือภาษาธรรมชาติ - เริ่มต้นใช้งาน

ในการติดตั้ง NLTK เราต้องติดตั้ง Python บนคอมพิวเตอร์ของเรา คุณสามารถไปที่ลิงค์www.python.org/downloadsและเลือกเวอร์ชันล่าสุดสำหรับระบบปฏิบัติการของคุณเช่น Windows, Mac และ Linux / Unix สำหรับการกวดวิชาพื้นฐานเกี่ยวกับงูหลามคุณสามารถดูการเชื่อมโยงwww.tutorialspoint.com/python3/index.htm

ตอนนี้เมื่อคุณติดตั้ง Python ในระบบคอมพิวเตอร์แล้วให้เราเข้าใจว่าเราจะติดตั้ง NLTK ได้อย่างไร

การติดตั้ง NLTK

เราสามารถติดตั้ง NLTK บน OS ต่างๆได้ดังนี้ -

บน Windows

ในการติดตั้ง NLTK บน Windows OS ให้ทำตามขั้นตอนด้านล่าง -

  • ขั้นแรกให้เปิดพรอมต์คำสั่งของ Windows และไปที่ตำแหน่งของไฟล์ pip โฟลเดอร์

  • จากนั้นป้อนคำสั่งต่อไปนี้เพื่อติดตั้ง NLTK -

pip3 install nltk

ตอนนี้เปิด PythonShell จาก Windows Start Menu และพิมพ์คำสั่งต่อไปนี้เพื่อตรวจสอบการติดตั้งของ NLTK -

Import nltk

หากคุณไม่พบข้อผิดพลาดแสดงว่าคุณติดตั้ง NLTK บน Windows OS ของคุณเรียบร้อยแล้วโดยใช้ Python3

บน Mac / Linux

ในการติดตั้ง NLTK บน Mac / Linux OS ให้เขียนคำสั่งต่อไปนี้ -

sudo pip install -U nltk

หากคุณไม่ได้ติดตั้ง pip บนคอมพิวเตอร์ของคุณให้ปฏิบัติตามคำแนะนำด้านล่างเพื่อติดตั้งครั้งแรก pip -

ขั้นแรกให้อัพเดตดัชนีแพ็คเกจโดยทำตามคำสั่งต่อไปนี้ -

sudo apt update

ตอนนี้พิมพ์คำสั่งต่อไปนี้เพื่อติดตั้ง pip สำหรับ python 3 -

sudo apt install python3-pip

ผ่าน Anaconda

ในการติดตั้ง NLTK ผ่าน Anaconda ให้ทำตามขั้นตอนด้านล่าง -

ขั้นแรกในการติดตั้ง Anaconda ให้ไปที่ลิงค์www.anaconda.com/distribution/#download-sectionจากนั้นเลือกเวอร์ชันของ Python ที่คุณต้องการติดตั้ง

เมื่อคุณมี Anaconda ในระบบคอมพิวเตอร์ของคุณแล้วให้ไปที่พรอมต์คำสั่งและเขียนคำสั่งต่อไปนี้ -

conda install -c anaconda nltk

คุณต้องตรวจสอบผลลัพธ์และป้อน 'ใช่' NLTK จะถูกดาวน์โหลดและติดตั้งในแพ็คเกจ Anaconda ของคุณ

กำลังดาวน์โหลดชุดข้อมูลและแพ็คเกจของ NLTK

ตอนนี้เราติดตั้ง NLTK ในคอมพิวเตอร์แล้ว แต่ในการใช้งานเราจำเป็นต้องดาวน์โหลดชุดข้อมูล (คลังข้อมูล) ที่มีอยู่ในนั้น ชุดข้อมูลที่สำคัญบางส่วนมีอยู่stpwords, guntenberg, framenet_v15 และอื่น ๆ

ด้วยความช่วยเหลือของคำสั่งต่อไปนี้เราสามารถดาวน์โหลดชุดข้อมูล NLTK ทั้งหมด -

import nltk
nltk.download()

คุณจะได้รับหน้าต่างดาวน์โหลด NLTK ต่อไปนี้

ตอนนี้คลิกที่ปุ่มดาวน์โหลดเพื่อดาวน์โหลดชุดข้อมูล

วิธีเรียกใช้สคริปต์ NLTK

ต่อไปนี้เป็นตัวอย่างที่เราใช้อัลกอริทึม Porter Stemmer โดยใช้ PorterStemmerคลาส nltk ด้วยตัวอย่างนี้คุณจะสามารถเข้าใจวิธีเรียกใช้สคริปต์ NLTK

ขั้นแรกเราต้องนำเข้าชุดเครื่องมือภาษาธรรมชาติ (nltk)

import nltk

ตอนนี้นำเข้าไฟล์ PorterStemmer คลาสเพื่อใช้อัลกอริทึม Porter Stemmer

from nltk.stem import PorterStemmer

จากนั้นสร้างอินสแตนซ์ของคลาส Porter Stemmer ดังนี้ -

word_stemmer = PorterStemmer()

ตอนนี้ป้อนคำที่คุณต้องการตั้งต้น -

word_stemmer.stem('writing')

เอาต์พุต

'write'
word_stemmer.stem('eating')

เอาต์พุต

'eat'