ชุดเครื่องมือภาษาธรรมชาติ - เริ่มต้นใช้งาน
ในการติดตั้ง NLTK เราต้องติดตั้ง Python บนคอมพิวเตอร์ของเรา คุณสามารถไปที่ลิงค์www.python.org/downloadsและเลือกเวอร์ชันล่าสุดสำหรับระบบปฏิบัติการของคุณเช่น Windows, Mac และ Linux / Unix สำหรับการกวดวิชาพื้นฐานเกี่ยวกับงูหลามคุณสามารถดูการเชื่อมโยงwww.tutorialspoint.com/python3/index.htm
ตอนนี้เมื่อคุณติดตั้ง Python ในระบบคอมพิวเตอร์แล้วให้เราเข้าใจว่าเราจะติดตั้ง NLTK ได้อย่างไร
การติดตั้ง NLTK
เราสามารถติดตั้ง NLTK บน OS ต่างๆได้ดังนี้ -
บน Windows
ในการติดตั้ง NLTK บน Windows OS ให้ทำตามขั้นตอนด้านล่าง -
ขั้นแรกให้เปิดพรอมต์คำสั่งของ Windows และไปที่ตำแหน่งของไฟล์ pip โฟลเดอร์
จากนั้นป้อนคำสั่งต่อไปนี้เพื่อติดตั้ง NLTK -
pip3 install nltk
ตอนนี้เปิด PythonShell จาก Windows Start Menu และพิมพ์คำสั่งต่อไปนี้เพื่อตรวจสอบการติดตั้งของ NLTK -
Import nltk
หากคุณไม่พบข้อผิดพลาดแสดงว่าคุณติดตั้ง NLTK บน Windows OS ของคุณเรียบร้อยแล้วโดยใช้ Python3
บน Mac / Linux
ในการติดตั้ง NLTK บน Mac / Linux OS ให้เขียนคำสั่งต่อไปนี้ -
sudo pip install -U nltk
หากคุณไม่ได้ติดตั้ง pip บนคอมพิวเตอร์ของคุณให้ปฏิบัติตามคำแนะนำด้านล่างเพื่อติดตั้งครั้งแรก pip -
ขั้นแรกให้อัพเดตดัชนีแพ็คเกจโดยทำตามคำสั่งต่อไปนี้ -
sudo apt update
ตอนนี้พิมพ์คำสั่งต่อไปนี้เพื่อติดตั้ง pip สำหรับ python 3 -
sudo apt install python3-pip
ผ่าน Anaconda
ในการติดตั้ง NLTK ผ่าน Anaconda ให้ทำตามขั้นตอนด้านล่าง -
ขั้นแรกในการติดตั้ง Anaconda ให้ไปที่ลิงค์www.anaconda.com/distribution/#download-sectionจากนั้นเลือกเวอร์ชันของ Python ที่คุณต้องการติดตั้ง
เมื่อคุณมี Anaconda ในระบบคอมพิวเตอร์ของคุณแล้วให้ไปที่พรอมต์คำสั่งและเขียนคำสั่งต่อไปนี้ -
conda install -c anaconda nltk
คุณต้องตรวจสอบผลลัพธ์และป้อน 'ใช่' NLTK จะถูกดาวน์โหลดและติดตั้งในแพ็คเกจ Anaconda ของคุณ
กำลังดาวน์โหลดชุดข้อมูลและแพ็คเกจของ NLTK
ตอนนี้เราติดตั้ง NLTK ในคอมพิวเตอร์แล้ว แต่ในการใช้งานเราจำเป็นต้องดาวน์โหลดชุดข้อมูล (คลังข้อมูล) ที่มีอยู่ในนั้น ชุดข้อมูลที่สำคัญบางส่วนมีอยู่stpwords, guntenberg, framenet_v15 และอื่น ๆ
ด้วยความช่วยเหลือของคำสั่งต่อไปนี้เราสามารถดาวน์โหลดชุดข้อมูล NLTK ทั้งหมด -
import nltk
nltk.download()
คุณจะได้รับหน้าต่างดาวน์โหลด NLTK ต่อไปนี้
ตอนนี้คลิกที่ปุ่มดาวน์โหลดเพื่อดาวน์โหลดชุดข้อมูล
วิธีเรียกใช้สคริปต์ NLTK
ต่อไปนี้เป็นตัวอย่างที่เราใช้อัลกอริทึม Porter Stemmer โดยใช้ PorterStemmerคลาส nltk ด้วยตัวอย่างนี้คุณจะสามารถเข้าใจวิธีเรียกใช้สคริปต์ NLTK
ขั้นแรกเราต้องนำเข้าชุดเครื่องมือภาษาธรรมชาติ (nltk)
import nltk
ตอนนี้นำเข้าไฟล์ PorterStemmer คลาสเพื่อใช้อัลกอริทึม Porter Stemmer
from nltk.stem import PorterStemmer
จากนั้นสร้างอินสแตนซ์ของคลาส Porter Stemmer ดังนี้ -
word_stemmer = PorterStemmer()
ตอนนี้ป้อนคำที่คุณต้องการตั้งต้น -
word_stemmer.stem('writing')
เอาต์พุต
'write'
word_stemmer.stem('eating')
เอาต์พุต
'eat'