ใน OCR ฉันจะจัดการกับข้อความที่บิดเบี้ยวที่ด้านข้างของวัตถุวงรีได้อย่างไร?
พิจารณาภาพที่มีหนึ่งกระป๋อง (หรือขวดหรือวัตถุรูปไข่ที่คล้ายกัน) ซึ่งมีข้อความอยู่ทั่ว ในภาพด้านล่างฉันมีขวดมากมาย แต่คุณสามารถสันนิษฐานได้ว่าแต่ละภาพมีวัตถุดังกล่าวเพียงชิ้นเดียว
อย่างที่เราเห็นในแต่ละกระป๋องข้อความสามารถไหลจากซ้ายไปขวาและระบบ OCR ใด ๆ อาจพลาดข้อความทางด้านซ้ายและด้านขวาของกระป๋องเนื่องจากไม่ได้อยู่ในแนวเดียวกันกับมุมกล้อง
มีวิธีแก้ปัญหาสำหรับสิ่งนี้เช่นการประมวลผลล่วงหน้าในลักษณะใดวิธีหนึ่งเพื่อให้เราสามารถอ่านข้อความหรือทำให้วัตถุทรงกลมนี้เป็นแบบตรงได้หรือไม่? (หากมีโปรแกรม Python ที่สามารถแก้ปัญหานี้ได้โปรดแบ่งปันให้ฉันทราบได้ไหม)
คำตอบ
มีเอกสารมากมายเกี่ยวกับเรื่องนี้ แต่สิ่งต่อไปนี้เป็นการเริ่มต้นที่ดี:
- วิธีการแกะฉลากไวน์โปรแกรม ผู้เขียนรวมซอร์สโค้ดไว้ใน Python
คุณบอกว่าคุณไม่ต้องการชมวิวแบบพาโนรามา แต่มีมากกว่าหนึ่งความหมาย ถ้าผมถือว่าคุณหมายความว่าคุณไม่ต้องการที่จะหมุนสามารถในขณะที่การถ่ายภาพหลายหรือคุณไม่ต้องการที่จะใช้ภาพถ่ายหลายภาพจากมุมที่แตกต่างกันคุณอาจลองเลนส์ pericentric ซึ่งจะต้องมีการประมวลผลภาพเพื่อทำการแกะ ต้องการความละเอียดมากขึ้นเนื่องจากการห่อมีความรุนแรงมากขึ้น ข้อดีคือคุณจะมีภาพพื้นผิวทรงกระบอกเต็มรูปแบบเพียงภาพเดียวและจะไม่พลาดคุณสมบัติหรือข้อความใด ๆ