ที่เก็บ Python สองแห่งสำหรับการแสดงข้อความ

Nov 26 2020
จากการสร้างภาพที่สวยงามไปจนถึงการแสดงข้อความเป็นสิ่งที่เหลือเชื่อจริงๆที่คุณสามารถหาได้อย่างอิสระบนอินเทอร์เน็ตโดยเฉพาะอย่างยิ่งในภาษาโปรแกรมที่มีฐานผู้ใช้จำนวนมากเช่น Python เป็นเรื่องเหลือเชื่อที่พบหัวข้อนี้ใน GitHub ที่เรียกว่าการสร้างภาพข้อความ
ภาพโดย @scottwebb จาก Unsplash พร้อมข้อความที่เพิ่มโดยผู้เขียน

จากที่สร้างมาอย่างดีไปจนถึงการแสดงผลข้อความ

เป็นสิ่งที่เหลือเชื่อมากที่คุณสามารถหาได้อย่างอิสระบนอินเทอร์เน็ตโดยเฉพาะในภาษาโปรแกรมที่มีฐานผู้ใช้จำนวนมากเช่น Python มันเหลือเชื่อที่จะหาหัวข้อนี้บน GitHub เรียกว่าการสร้างภาพข้อความ ฉันคิดว่าฉันจะตรวจสอบที่เก็บที่ติดดาวมากที่สุด (repo (s)) ในหัวข้อนี้ ได้แก่ Texthero และ Scattertext

Texthero

ทันทีTextheroเริ่มต้นด้วยการแนะนำที่ง่าย

เป็นข้อมูลเกี่ยวกับ:

  1. การประมวลผลข้อความล่วงหน้า
  2. การเป็นตัวแทน
  3. การแสดงภาพ

“ Texthero เป็นชุดเครื่องมือ Python ที่ทำงานกับชุดข้อมูลแบบข้อความได้อย่างรวดเร็วและง่ายดาย Texthero นั้นง่ายมากในการเรียนรู้และออกแบบมาเพื่อใช้กับ Pandas”

รวมถึงเครื่องมือสำหรับหลาย ๆ ด้าน:

  • ข้อมูลข้อความก่อนประมวลผล : นำเสนอทั้งโซลูชันแบบสำเร็จรูป แต่ยังยืดหยุ่นสำหรับโซลูชันที่กำหนดเอง
  • การประมวลผลภาษาธรรมชาติ : การแยกคีย์เวิร์ดและคีย์เวิร์ดและการจดจำเอนทิตีที่มีชื่อ
  • การแสดงข้อความ : TF-IDF ความถี่ของคำและการฝังคำที่กำหนดเอง (wip)
  • การวิเคราะห์พื้นที่เวกเตอร์ : การจัดกลุ่ม (K-mean, Meanshift, DBSCAN และ Hierarchical), การสร้างแบบจำลองหัวข้อ (wip) และการตีความ
  • การแสดงข้อความ : การแสดงภาพพื้นที่เวกเตอร์วางตำแหน่งบนแผนที่ (wip)”

ข้อโต้แย้งของพวกเขาคือมันยากที่จะจัดการกับเครื่องมือ NLP ที่แตกต่างกัน (NLTK, SpaCy, Gensim, TextBlob, Sklearn)

นี่คือเหตุผลที่พวกเขาพัฒนาโซลูชันของพวกเขา

ติดตั้ง texthero ผ่านpip:

pip install texthero

เพื่อประสิทธิภาพที่เร็วขึ้นตรวจสอบให้แน่ใจว่าคุณได้ติดตั้ง Spacy version> = 2.2 นอกจากนี้ตรวจสอบให้แน่ใจว่าคุณมี python เวอร์ชันล่าสุด…”

สามารถดูสวยเรียบร้อย

ฉันอยากจะแนะนำให้คุณลองดู! ฉันจะลองทำในโครงการของฉัน

Scattertext

แพคเกจก็คือScattertext ฉันจะบอกว่าอันนี้เสริม นอกจากนี้มันค่อนข้างน่าประทับใจกับพล็อตเชิงโต้ตอบและอาจเป็นเรื่องที่เรียบร้อยหากคุณต้องการนำเสนอข้อมูลด้วยวิธีที่ดึงดูดสายตาโดยมีเงื่อนไขที่เหมาะสมสำหรับข้อมูล

“ เครื่องมือสำหรับค้นหาคำศัพท์ที่แตกต่างในองค์กรและนำเสนอในรูปแบบการกระจาย HTML แบบโต้ตอบ คะแนนที่เกี่ยวข้องกับคำจะถูกเลือกป้ายกำกับเพื่อไม่ให้ทับซ้อนกับป้ายกำกับหรือจุดอื่น ๆ ”

Scattertext มีเดโมมากมาย! ดังนั้นคุณจะพบตัวอย่างมากมายเพื่อทดลองหรือดึงแรงบันดาลใจจาก

หากคุณมีเอกสารจำนวนมากและต้องการให้แสดงความถี่รวมถึงเหตุการณ์ทั้งหมดนี้จะค่อนข้างดี

การแสดงภาพเป็นแบบโต้ตอบและค้นหาได้ ตรวจสอบออกที่นี่

เป็นเรื่องที่น่าทึ่งมากที่มีการสร้างผลงานประเภทนี้ขึ้นมาและการแบ่งปันทางออนไลน์จะเป็นประโยชน์

หวังว่านี่จะเป็นประโยชน์หากคุณกำลังทำงานกับข้อความอยู่

คุณน่าจะค้นพบสิ่งนี้ด้วยตัวเอง แต่ถ้าคุณกำลังติดตามการเดินทางของฉันฉันหวังว่าคุณจะค้นพบสิ่งที่คุณไม่เคยรู้มาก่อน

นี่คือ # 500daysofAI และคุณกำลังอ่านบทความ 440 ฉันกำลังเขียนบทความใหม่เกี่ยวกับหรือเกี่ยวข้องกับปัญญาประดิษฐ์ทุกวันเป็นเวลา 500 วัน