Gensim บทช่วยสอน
Gensim = “Generate Similar”เป็นไลบรารีการประมวลผลภาษาธรรมชาติแบบโอเพนซอร์สยอดนิยมที่ใช้สำหรับการสร้างแบบจำลองหัวข้อที่ไม่ได้รับการดูแล ใช้แบบจำลองทางวิชาการชั้นนำและการเรียนรู้ของเครื่องจักรทางสถิติที่ทันสมัยเพื่อทำงานที่ซับซ้อนต่างๆเช่น Building document หรือ word vectors, Corpora, การระบุหัวข้อ, การเปรียบเทียบเอกสาร (การดึงเอกสารที่มีความหมายคล้ายกัน), การวิเคราะห์เอกสารข้อความธรรมดาสำหรับโครงสร้างความหมาย
บทแนะนำนี้จะเป็นประโยชน์สำหรับผู้สำเร็จการศึกษาระดับหลังปริญญาและนักศึกษาวิจัยที่มีความสนใจในการประมวลผลภาษาธรรมชาติ (NLP) การสร้างแบบจำลองหัวข้อหรือมีวิชาเหล่านี้เป็นส่วนหนึ่งของหลักสูตร ผู้อ่านอาจเป็นผู้เริ่มต้นหรือผู้เรียนขั้นสูง
ผู้อ่านต้องมีความรู้พื้นฐานเกี่ยวกับ NLP และควรทราบถึงแนวคิดการเขียนโปรแกรม Python