OCR에서 타원형 개체 측면의 뒤틀린 텍스트를 어떻게 처리해야합니까?

Jan 06 2021

전체에 텍스트가있는 캔 (또는 병 또는 유사한 타원형 물체)이 포함 된 이미지를 생각해보십시오. 아래 이미지에는 많은 병이 있지만 각 이미지에는 이러한 개체가 하나만 포함되어 있다고 가정 할 수 있습니다.

보시다시피 각 캔에서 텍스트는 왼쪽에서 오른쪽으로 흐를 수 있으며 모든 OCR 시스템은 캔의 왼쪽과 오른쪽에있는 텍스트가 카메라 각도와 정렬되지 않기 때문에 누락 될 수 있습니다.

그래서, 우리가 텍스트를 읽거나이 둥근 물체를 직선 물체로 만들 수 있도록 특정한 방식으로 전처리하는 것과 같은 해결책이 있습니까? (이 문제를 해결할 수있는 파이썬 프로그램이 있다면 저와 공유해 주시겠습니까?)

답변

2 BrianO'Donnell Jan 08 2021 at 01:25

이에 대한 많은 논문이 있지만 다음은 좋은 시작입니다.

  • 프로그래밍 방식으로 와인 라벨을 푸는 방법 . 작성자는 Python에 소스 코드 를 포함 합니다 .

당신은 파노라마 뷰를하고 싶지 않지만 하나 이상의 의미를 가지고 있다고 언급했습니다. 여러 장의 사진을 찍는 동안 캔을 회전하고 싶지 않거나 다른 각도에서 여러 장의 사진을 찍고 싶지 않다면 pericentric lens를 사용해 볼 수 있습니다. 언 래핑을 수행하려면 이미지 처리가 필요합니다. 랩핑이 훨씬 더 심각하므로 더 많은 해상도가 필요합니다. 그러나 장점은 전체 원통형 표면의 단일 이미지를 갖게되고 기능이나 텍스트를 놓치지 않는다는 것입니다.