Dans l'OCR, comment dois-je gérer le texte déformé sur les côtés des objets ovales?
Considérez une image qui contient une canette (ou une bouteille, ou tout autre objet ovale similaire), qui contient des textes partout. Dans l'image ci-dessous, j'ai de nombreuses bouteilles, mais vous pouvez supposer que chaque image ne contient qu'un seul objet de ce type.

Comme nous pouvons le voir, dans chaque boîte, le texte peut circuler de gauche à droite, et tout système OCR peut manquer le texte sur les côtés gauche et droit de la boîte, car ils ne sont pas alignés avec l'angle de la caméra.
Alors, y a-t-il une / des solution / s pour cela, comme le prétraitement d'une certaine manière, afin que nous puissions lire le texte ou transformer cet objet rond en un objet droit? (S'il existe un programme Python qui peut résoudre ce problème, pourriez-vous le partager avec moi?)
Réponses
Il existe de nombreux articles à ce sujet, mais ce qui suit est un bon début:
- Comment déballer les étiquettes de vin par programmation . L'auteur inclut le code source en Python.

Vous avez mentionné que vous ne vouliez pas faire de vue panoramique, mais cela a plus d'une signification. Si je suppose que vous voulez dire que vous ne voulez pas faire pivoter la boîte tout en prenant plusieurs photos, ou que vous ne voulez pas prendre plusieurs photos sous des angles différents, vous pouvez essayer un objectif péricentrique . Cela nécessiterait un certain traitement d'image pour faire le déballage. Une plus grande résolution est nécessaire car l'enroulement est beaucoup plus sévère. L'avantage cependant est que vous aurez une seule image de la surface cylindrique complète et que vous ne manquerez aucune caractéristique ou texte.
