ที่เก็บ Python สองแห่งสำหรับการแสดงข้อความ
จากที่สร้างมาอย่างดีไปจนถึงการแสดงผลข้อความ
เป็นสิ่งที่เหลือเชื่อมากที่คุณสามารถหาได้อย่างอิสระบนอินเทอร์เน็ตโดยเฉพาะในภาษาโปรแกรมที่มีฐานผู้ใช้จำนวนมากเช่น Python มันเหลือเชื่อที่จะหาหัวข้อนี้บน GitHub เรียกว่าการสร้างภาพข้อความ ฉันคิดว่าฉันจะตรวจสอบที่เก็บที่ติดดาวมากที่สุด (repo (s)) ในหัวข้อนี้ ได้แก่ Texthero และ Scattertext
Texthero
ทันทีTextheroเริ่มต้นด้วยการแนะนำที่ง่าย
เป็นข้อมูลเกี่ยวกับ:
- การประมวลผลข้อความล่วงหน้า
- การเป็นตัวแทน
- การแสดงภาพ
“ Texthero เป็นชุดเครื่องมือ Python ที่ทำงานกับชุดข้อมูลแบบข้อความได้อย่างรวดเร็วและง่ายดาย Texthero นั้นง่ายมากในการเรียนรู้และออกแบบมาเพื่อใช้กับ Pandas”
รวมถึงเครื่องมือสำหรับหลาย ๆ ด้าน:
- “ ข้อมูลข้อความก่อนประมวลผล : นำเสนอทั้งโซลูชันแบบสำเร็จรูป แต่ยังยืดหยุ่นสำหรับโซลูชันที่กำหนดเอง
- การประมวลผลภาษาธรรมชาติ : การแยกคีย์เวิร์ดและคีย์เวิร์ดและการจดจำเอนทิตีที่มีชื่อ
- การแสดงข้อความ : TF-IDF ความถี่ของคำและการฝังคำที่กำหนดเอง (wip)
- การวิเคราะห์พื้นที่เวกเตอร์ : การจัดกลุ่ม (K-mean, Meanshift, DBSCAN และ Hierarchical), การสร้างแบบจำลองหัวข้อ (wip) และการตีความ
- การแสดงข้อความ : การแสดงภาพพื้นที่เวกเตอร์วางตำแหน่งบนแผนที่ (wip)”
ข้อโต้แย้งของพวกเขาคือมันยากที่จะจัดการกับเครื่องมือ NLP ที่แตกต่างกัน (NLTK, SpaCy, Gensim, TextBlob, Sklearn)
นี่คือเหตุผลที่พวกเขาพัฒนาโซลูชันของพวกเขา
ติดตั้ง texthero ผ่านpip
:
pip install texthero
เพื่อประสิทธิภาพที่เร็วขึ้นตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Spacy version> = 2.2 นอกจากนี้ตรวจสอบให้แน่ใจว่าคุณมี python เวอร์ชันล่าสุด…”
สามารถดูสวยเรียบร้อย
ฉันอยากจะแนะนำให้คุณลองดู! ฉันจะลองทำในโครงการของฉัน
Scattertext
แพคเกจก็คือScattertext ฉันจะบอกว่าอันนี้เสริม นอกจากนี้มันค่อนข้างน่าประทับใจกับพล็อตเชิงโต้ตอบและอาจเป็นเรื่องที่เรียบร้อยหากคุณต้องการนำเสนอข้อมูลด้วยวิธีที่ดึงดูดสายตาโดยมีเงื่อนไขที่เหมาะสมสำหรับข้อมูล
“ เครื่องมือสำหรับค้นหาคำศัพท์ที่แตกต่างในองค์กรและนำเสนอในรูปแบบการกระจาย HTML แบบโต้ตอบ คะแนนที่เกี่ยวข้องกับคำจะถูกเลือกป้ายกำกับเพื่อไม่ให้ทับซ้อนกับป้ายกำกับหรือจุดอื่น ๆ ”
Scattertext มีเดโมมากมาย! ดังนั้นคุณจะพบตัวอย่างมากมายเพื่อทดลองหรือดึงแรงบันดาลใจจาก
หากคุณมีเอกสารจำนวนมากและต้องการให้แสดงความถี่รวมถึงเหตุการณ์ทั้งหมดนี้จะค่อนข้างดี
การแสดงภาพเป็นแบบโต้ตอบและค้นหาได้ ตรวจสอบออกที่นี่
เป็นเรื่องที่น่าทึ่งมากที่มีการสร้างผลงานประเภทนี้ขึ้นมาและการแบ่งปันทางออนไลน์จะเป็นประโยชน์
หวังว่านี่จะเป็นประโยชน์หากคุณกำลังทำงานกับข้อความอยู่
คุณน่าจะค้นพบสิ่งนี้ด้วยตัวเอง แต่ถ้าคุณกำลังติดตามการเดินทางของฉันฉันหวังว่าคุณจะค้นพบสิ่งที่คุณไม่เคยรู้มาก่อน
นี่คือ # 500daysofAI และคุณกำลังอ่านบทความ 440 ฉันกำลังเขียนบทความใหม่เกี่ยวกับหรือเกี่ยวข้องกับปัญญาประดิษฐ์ทุกวันเป็นเวลา 500 วัน