Metin Görselleştirme için İki Python Deposu
Metin görselleştirmeleri için iyi yapılmıştan hayranlığa
İnternette, özellikle Python gibi geniş bir kullanıcı tabanına sahip programlama dillerinde özgürce bulabileceğiniz şeyler gerçekten inanılmaz. Bunun için GitHub'da metin görselleştirme adı verilen bir konu bulmak inanılmaz . Bu konudaki en yıldızlı iki depoyu (depoları) inceleyeceğimi düşündüm: Texthero ve Scattertext.
Texthero
Texthero hemen kolay bir girişle başlar.
Her şey şunlarla ilgili:
- Metin ön işleme.
- Temsil.
- Görselleştirme.
"Texthero, metin tabanlı veri kümesiyle hızlı ve zahmetsizce çalışmak için bir python araç setidir. Texthero'nun öğrenmesi çok basit ve Pandaların üzerinde kullanılmak üzere tasarlandı. "
Birkaç yön için araçlar içerir:
- " Metin verilerini ön işleme : hem kullanıma hazır çözümler sunar hem de özel çözümler için esnektir.
- Doğal Dil İşleme : anahtar sözcükler ve anahtar sözcük çıkarma ve adlandırılmış varlık tanıma.
- Metin gösterimi : TF-IDF, terim sıklığı ve özel kelime yerleştirme (wip)
- Vektör uzayı analizi : kümeleme (K-ortalamalar, Meanshift, DBSCAN ve Hiyerarşik), konu modelleme (wip) ve yorumlama.
- Metin görselleştirme : vektör alanı görselleştirme, haritalarda yer yerelleştirme (wip). "
Argümanları, farklı NLP araçlarıyla (NLTK, SpaCy, Gensim, TextBlob, Sklearn) uğraşmanın zor olduğudur.
Bu yüzden çözümlerini geliştirdiler.
Texthero'yu şu yolla yükleyin pip
:
pip install texthero
Daha hızlı performans için, Spacy sürüm> = 2.2'yi kurduğunuzdan emin olun. Ayrıca, python'un yeni bir sürümüne sahip olduğunuzdan emin olun… ”
Oldukça düzgün görünebilir.
Kontrol etmenizi tavsiye ederim! Bunu projemde deneyeceğim.
Dağılım metni
Başka bir paket Scattertext'tir . Bunun tamamlayıcı olduğunu söyleyebilirim. Ek olarak, etkileşimli bir arsa ile oldukça etkileyicidir ve veriler için doğru koşullar göz önüne alındığında, bilgileri görsel olarak çekici bir şekilde sunmak istiyorsanız, düzgün olabilir.
"Derlemede ayırt edici terimleri bulmak ve bunları etkileşimli, HTML dağılım grafiğinde sunmak için bir araç. Terimlere karşılık gelen noktalar, diğer etiketler veya noktalarla çakışmamaları için seçici olarak etiketlenir. "
Scattertext'in çok sayıda demosu var! Bu nedenle, denemek veya ilham almak için birçok örnek bulacaksınız.
Çok sayıda belgeniz varsa ve tüm oluşumların yanı sıra sıklığın görüntülenmesini istiyorsanız, bu oldukça mükemmel olabilir.
Görselleştirme etkileşimli ve aranabilir. Buradan kontrol edin .
Bunu yapmak için ne tür bir çalışma yapıldığı şaşırtıcı ve çevrimiçi olarak paylaşılması yararlı.
Şu anda metin üzerinde çalışıyorsanız bunun yararlı olduğunu umuyoruz.
Muhtemelen bunu kendiniz bulmuş olabilirsiniz, ancak yolculuğumu takip ediyorsanız, umarım daha önce bilmediğiniz bir şeyi keşfetmişsinizdir.
Bu # 500daysofAI ve 440. makaleyi okuyorsunuz. 500 gün boyunca her gün yapay zeka hakkında veya yapay zeka ile ilgili yeni bir makale yazıyorum.