पाठ विज़ुअलाइज़ेशन के लिए दो पायथन रिपॉजिटरी
पाठ दृश्य के लिए अच्छी तरह से वाह से
यह वास्तव में अविश्वसनीय है कि आप इंटरनेट पर आसानी से उपलब्ध हो सकते हैं, विशेष रूप से पायथन जैसे बड़े उपयोगकर्ता आधार के साथ प्रोग्रामिंग भाषाओं के भीतर। GitHub पर इसके लिए एक विषय खोजना अविश्वसनीय है जिसे टेक्स्ट विज़ुअलाइज़ेशन कहा जाता है । मैंने सोचा कि मैं इस विषय में दो सबसे अधिक अभिनीत रिपोजिटरी (रेपो) की जांच करूँगा, अर्थात्: टेक्सथेरो और स्कैटरटेक्स्ट।
Texthero
सीधे टेक्सथरो एक आसान परिचय के साथ शुरू होता है।
यह सब के बारे में हैं:
- टेक्स्ट प्रीप्रोसेसिंग।
- प्रदर्शन।
- दृश्य।
"टेक्सथेरो टेक्स्ट-आधारित डेटासेट के साथ जल्दी और आसानी से काम करने के लिए एक अजगर टूलकिट है। टेक्सथो सीखना बहुत सरल है और इसे पंडों के शीर्ष पर उपयोग करने के लिए डिज़ाइन किया गया है। ”
इसमें कई पहलुओं के उपकरण शामिल हैं:
- " प्रीप्रोसेस टेक्स्ट डेटा : यह दोनों आउट-ऑफ-द-बॉक्स समाधान प्रदान करता है, लेकिन यह कस्टम-समाधान के लिए भी लचीला है।
- प्राकृतिक भाषा प्रसंस्करण : कीफ्रेसेस और कीवर्ड निष्कर्षण, और नामित इकाई मान्यता।
- पाठ प्रतिनिधित्व : TF-IDF, शब्द आवृत्ति और कस्टम शब्द-एम्बेडिंग (wip)
- वेक्टर अंतरिक्ष विश्लेषण : क्लस्टरिंग (K- साधन, मीनशिफ्ट, DBSCAN और पदानुक्रमित), विषय मॉडलिंग (wip) और व्याख्या।
- टेक्स्ट विज़ुअलाइज़ेशन : वेक्टर स्पेस विज़ुअलाइज़ेशन, मानचित्रों पर स्थानीयकरण रखें (wip)। "
उनका तर्क है कि विभिन्न एनएलपी टूल्स (एनएलटीके, स्पासी, गेंसिम, टेक्स्टब्लो, स्केलेरन) से निपटना कठिन है।
यही कारण है कि उन्होंने अपना समाधान विकसित किया।
के माध्यम से टेक्थरो स्थापित करें pip
:
pip install texthero
तेज़ प्रदर्शन के लिए, सुनिश्चित करें कि आपने स्पैसिस संस्करण> = 2.2 स्थापित किया है। इसके अलावा, सुनिश्चित करें कि आपके पास अजगर का हालिया संस्करण है… ”
यह बहुत साफ दिख सकता है।
मैं आपको इसकी जांच करने की सलाह दूंगा! मैं इसे अपने प्रोजेक्ट पर आजमाऊंगा।
Scattertext
एक और पैकेज स्कैटरटेक्स्ट है । मैं कहूंगा कि यह एक पूरक है। इसके अतिरिक्त यह एक इंटरएक्टिव प्लॉट के साथ काफी प्रभावशाली है, और यह साफ-सुथरा हो सकता है यदि आप डेटा के लिए सही परिस्थितियों को देखते हुए एक आकर्षक तरीके से जानकारी प्रस्तुत करना चाहते हैं।
“कॉर्पोरा में विशिष्ट शब्दों को खोजने और उन्हें एक इंटरैक्टिव, HTML स्कैटर प्लॉट में प्रस्तुत करने के लिए एक उपकरण। शर्तों के अनुरूप अंक चुनिंदा रूप से लेबल किए जाते हैं ताकि वे अन्य लेबल या बिंदुओं के साथ ओवरलैप न हों। "
Scattertext में बहुत सारे डेमो हैं! इसलिए, आपको प्रेरणा के साथ प्रयोग करने या आकर्षित करने के लिए बहुत सारे उदाहरण मिलेंगे।
यदि आपके पास बहुत सारे दस्तावेज हैं और चाहते हैं कि आवृत्ति प्रदर्शित हो और साथ ही सभी घटनाएँ भी उत्कृष्ट हों।
दृश्य इंटरैक्टिव और खोज योग्य है। इसे यहां देखें ।
यह आश्चर्यजनक है कि इसे बनाने में किस तरह का काम हुआ है और यह मददगार है कि इसे ऑनलाइन साझा किया गया है।
आशा है कि यह उपयोगी था यदि आप वर्तमान में पाठ के साथ काम कर रहे हैं।
आप संभवतः इसे स्वयं पा सकते हैं, लेकिन यदि आप मेरी यात्रा का अनुसरण कर रहे हैं, तो मुझे आशा है कि आपने कुछ ऐसा खोज लिया है जिसके बारे में आप पहले नहीं जानते थे।
यह # 500daysofAI है और आप लेख 440 पढ़ रहे हैं। मैं 500 दिनों के लिए प्रतिदिन कृत्रिम बुद्धिमत्ता के बारे में या उससे संबंधित एक नया लेख लिख रहा हूं।