पाठ विज़ुअलाइज़ेशन के लिए दो पायथन रिपॉजिटरी

Nov 26 2020
टेक्स्ट विज़ुअलाइज़ेशन के लिए अच्छी तरह से वाह करने से लेकर यह वास्तव में अविश्वसनीय है कि आप इंटरनेट पर आसानी से उपलब्ध हो सकते हैं, विशेष रूप से पायथन जैसे बड़े उपयोगकर्ता आधार के साथ प्रोग्रामिंग भाषाओं के भीतर। GitHub पर इसके लिए एक विषय खोजना अविश्वसनीय है जिसे टेक्स्ट विज़ुअलाइज़ेशन कहा जाता है।
लेखक द्वारा जोड़े गए पाठ के साथ Unsplash से @scottwebb द्वारा फोटो

पाठ दृश्य के लिए अच्छी तरह से वाह से

यह वास्तव में अविश्वसनीय है कि आप इंटरनेट पर आसानी से उपलब्ध हो सकते हैं, विशेष रूप से पायथन जैसे बड़े उपयोगकर्ता आधार के साथ प्रोग्रामिंग भाषाओं के भीतर। GitHub पर इसके लिए एक विषय खोजना अविश्वसनीय है जिसे टेक्स्ट विज़ुअलाइज़ेशन कहा जाता है । मैंने सोचा कि मैं इस विषय में दो सबसे अधिक अभिनीत रिपोजिटरी (रेपो) की जांच करूँगा, अर्थात्: टेक्सथेरो और स्कैटरटेक्स्ट।

Texthero

सीधे टेक्सथरो एक आसान परिचय के साथ शुरू होता है।

यह सब के बारे में हैं:

  1. टेक्स्ट प्रीप्रोसेसिंग।
  2. प्रदर्शन।
  3. दृश्य।

"टेक्सथेरो टेक्स्ट-आधारित डेटासेट के साथ जल्दी और आसानी से काम करने के लिए एक अजगर टूलकिट है। टेक्सथो सीखना बहुत सरल है और इसे पंडों के शीर्ष पर उपयोग करने के लिए डिज़ाइन किया गया है। ”

इसमें कई पहलुओं के उपकरण शामिल हैं:

  • " प्रीप्रोसेस टेक्स्ट डेटा : यह दोनों आउट-ऑफ-द-बॉक्स समाधान प्रदान करता है, लेकिन यह कस्टम-समाधान के लिए भी लचीला है।
  • प्राकृतिक भाषा प्रसंस्करण : कीफ्रेसेस और कीवर्ड निष्कर्षण, और नामित इकाई मान्यता।
  • पाठ प्रतिनिधित्व : TF-IDF, शब्द आवृत्ति और कस्टम शब्द-एम्बेडिंग (wip)
  • वेक्टर अंतरिक्ष विश्लेषण : क्लस्टरिंग (K- साधन, मीनशिफ्ट, DBSCAN और पदानुक्रमित), विषय मॉडलिंग (wip) और व्याख्या।
  • टेक्स्ट विज़ुअलाइज़ेशन : वेक्टर स्पेस विज़ुअलाइज़ेशन, मानचित्रों पर स्थानीयकरण रखें (wip)। "

उनका तर्क है कि विभिन्न एनएलपी टूल्स (एनएलटीके, स्पासी, गेंसिम, टेक्स्टब्लो, स्केलेरन) से निपटना कठिन है।

यही कारण है कि उन्होंने अपना समाधान विकसित किया।

के माध्यम से टेक्थरो स्थापित करें pip:

pip install texthero

तेज़ प्रदर्शन के लिए, सुनिश्चित करें कि आपने स्पैसिस संस्करण> = 2.2 स्थापित किया है। इसके अलावा, सुनिश्चित करें कि आपके पास अजगर का हालिया संस्करण है… ”

यह बहुत साफ दिख सकता है।

मैं आपको इसकी जांच करने की सलाह दूंगा! मैं इसे अपने प्रोजेक्ट पर आजमाऊंगा।

Scattertext

एक और पैकेज स्कैटरटेक्स्ट है । मैं कहूंगा कि यह एक पूरक है। इसके अतिरिक्त यह एक इंटरएक्टिव प्लॉट के साथ काफी प्रभावशाली है, और यह साफ-सुथरा हो सकता है यदि आप डेटा के लिए सही परिस्थितियों को देखते हुए एक आकर्षक तरीके से जानकारी प्रस्तुत करना चाहते हैं।

“कॉर्पोरा में विशिष्ट शब्दों को खोजने और उन्हें एक इंटरैक्टिव, HTML स्कैटर प्लॉट में प्रस्तुत करने के लिए एक उपकरण। शर्तों के अनुरूप अंक चुनिंदा रूप से लेबल किए जाते हैं ताकि वे अन्य लेबल या बिंदुओं के साथ ओवरलैप न हों। "

Scattertext में बहुत सारे डेमो हैं! इसलिए, आपको प्रेरणा के साथ प्रयोग करने या आकर्षित करने के लिए बहुत सारे उदाहरण मिलेंगे।

यदि आपके पास बहुत सारे दस्तावेज हैं और चाहते हैं कि आवृत्ति प्रदर्शित हो और साथ ही सभी घटनाएँ भी उत्कृष्ट हों।

दृश्य इंटरैक्टिव और खोज योग्य है। इसे यहां देखें ।

यह आश्चर्यजनक है कि इसे बनाने में किस तरह का काम हुआ है और यह मददगार है कि इसे ऑनलाइन साझा किया गया है।

आशा है कि यह उपयोगी था यदि आप वर्तमान में पाठ के साथ काम कर रहे हैं।

आप संभवतः इसे स्वयं पा सकते हैं, लेकिन यदि आप मेरी यात्रा का अनुसरण कर रहे हैं, तो मुझे आशा है कि आपने कुछ ऐसा खोज लिया है जिसके बारे में आप पहले नहीं जानते थे।

यह # 500daysofAI है और आप लेख 440 पढ़ रहे हैं। मैं 500 दिनों के लिए प्रतिदिन कृत्रिम बुद्धिमत्ता के बारे में या उससे संबंधित एक नया लेख लिख रहा हूं।