In OCR, come devo gestire il testo deformato sui lati degli oggetti ovali?

Jan 06 2021

Considera un'immagine che contiene una lattina (o una bottiglia, o qualsiasi oggetto ovale simile), che ha testi dappertutto. Nell'immagine qui sotto, ho molte bottiglie, ma puoi presumere che ogni immagine contenga solo uno di questi oggetti.

Come possiamo vedere, in ogni lattina, il testo può fluire da sinistra a destra e qualsiasi sistema OCR potrebbe perdere il testo sui lati sinistro e destro della lattina, poiché non sono allineati con l'angolazione della telecamera.

Quindi, c'è qualche soluzione per questo, come la preelaborazione in un certo modo, in modo che possiamo leggere il testo o trasformare questo oggetto rotondo in uno diritto? (Se esiste un programma Python in grado di risolvere questo problema, potresti condividerlo con me?)

Risposte

2 BrianO'Donnell Jan 08 2021 at 01:25

Ci sono molti articoli su questo, ma il seguente è un buon inizio:

  • Come scartare le etichette dei vini in modo programmatico . L'autore include il codice sorgente in Python.

Hai detto che non vuoi fare una vista panoramica ma questo ha più di un significato. Se presumo che intendi dire che non vuoi ruotare la lattina mentre scatti più foto, o non vuoi scattare più foto da diverse angolazioni, potresti provare un obiettivo pericentrico . Ciò richiederebbe un'elaborazione dell'immagine per eseguire lo scartamento. È necessaria una maggiore risoluzione poiché l'avvolgimento è molto più severo. Il vantaggio però è che avrai una singola immagine dell'intera superficie cilindrica e non perderai nessuna caratteristica o testo.