OCR'de, oval nesnelerin kenarlarındaki çarpık metinle nasıl başa çıkmalıyım?

Jan 06 2021

Her tarafında metinler bulunan bir teneke kutuyu (veya şişeyi veya benzer herhangi bir oval nesneyi) içeren bir resim düşünün. Aşağıdaki resimde çok sayıda şişem var, ancak her görüntünün sadece böyle bir nesne içerdiğini varsayabilirsiniz.

Gördüğümüz gibi, her kutuda metin soldan sağa doğru akabilir ve herhangi bir OCR sistemi, kamera açısıyla hizalanmadıkları için kutunun sol ve sağ taraflarındaki metni gözden kaçırabilir.

Öyleyse, metni okuyabilmemiz veya bu yuvarlak nesneyi düz hale getirebilmemiz için belirli bir şekilde ön işleme gibi bunun için herhangi bir çözüm / çözüm var mı? (Bu sorunu çözebilecek herhangi bir Python programı varsa lütfen benimle paylaşır mısınız?)

Yanıtlar

2 BrianO'Donnell Jan 08 2021 at 01:25

Bununla ilgili çok sayıda makale var ama şu iyi bir başlangıç:

  • Şarap etiketleri programlı olarak nasıl açılır . Yazar, Python'da kaynak kodunu içerir .

Panoramik bir manzara yapmak istemediğinizi ama bunun birden fazla anlamı olduğunu söylediniz. Birden fazla fotoğraf çekerken kutuyu döndürmek istemediğinizi veya farklı açılardan birden fazla fotoğraf çekmek istemediğinizi varsayarsam, perisentrik bir lens deneyebilirsiniz . Bu, sarmalamayı yapmak için biraz görüntü işleme gerektirecektir. Sarma çok daha şiddetli olduğundan daha fazla çözünürlüğe ihtiyaç vardır. Bunun avantajı, tam silindirik yüzeyin tek bir görüntüsüne sahip olmanız ve hiçbir özelliği veya metni gözden kaçırmamanızdır.