जेनसिम ट्यूटोरियल
Gensim = “Generate Similar”एक लोकप्रिय ओपन सोर्स नेचुरल लैंग्वेज प्रोसेसिंग लाइब्रेरी है, जिसका उपयोग अनछुए विषय मॉडलिंग के लिए किया जाता है। यह भवन निर्माण दस्तावेज या शब्द वैक्टर, कॉर्पोरा जैसे विभिन्न जटिल कार्यों को करने के लिए शीर्ष शैक्षणिक मॉडल और आधुनिक सांख्यिकीय मशीन लर्निंग का उपयोग करता है, विषय की पहचान करना, दस्तावेज़ की तुलना करना (शब्दार्थ समान दस्तावेजों को प्राप्त करना), शब्दार्थ संरचना के लिए सादे-पाठ दस्तावेजों का विश्लेषण करना।
यह ट्यूटोरियल स्नातक, स्नातकोत्तर और शोध छात्रों के लिए उपयोगी होगा, जिनकी या तो प्राकृतिक भाषा प्रसंस्करण (एनएलपी), टॉपिक मॉडलिंग में रुचि है या ये विषय उनके पाठ्यक्रम के हिस्से के रूप में हैं। पाठक एक शुरुआती या एक उन्नत शिक्षार्थी हो सकता है।
पाठक को एनएलपी के बारे में बुनियादी जानकारी होनी चाहिए और उसे पायथन प्रोग्रामिंग अवधारणाओं के बारे में भी जानकारी होनी चाहिए।