이미지의 프레임 텍스트 좌표
이미지에서 프레임 텍스트의 좌표를 얻고 싶습니다. 단락에는 얇은 검은 색 테두리가 있습니다. 나머지 이미지에는 일반적인 단락과 스케치가 포함되어 있습니다.
다음은 그 예입니다.

이것을 달성하기 위해 이미지 라이브러리와 함께 파이썬에서 어떤 종류의 알고리즘을 사용 해야하는지 알고 있습니까? 감사.
답변
상당한 크기의 상자 / 직사각형 검색에 주로 사용되는 프레임 텍스트를 감지하는 몇 가지 아이디어 :
OpenCV로 윤곽선을 찾고, 다각형 근사 알고리즘 ( Ramer–Douglas–Peucker 알고리즘 이라고도 함)을 사용하여 모양을 분석 합니다. 테두리 상자의 종횡비를 추가로 확인하여 모양이 직사각형인지 확인하고 귀하의 경우에 알려진 메트릭 인 것처럼 보이는 페이지 너비를 확인할 수 있습니다. PyImageSearch는 다음과 같은 놀라운 기사를 작성했습니다.cv2.approxPolyDP()
- OpenCV 모양 감지
A의 관련된 질문 으로 볼 수있는 제안도있다 호우 라인 A가 수직 라인을 탐지 같은 방법으로 전원 켜기, 수평 라인을 검출하기는. 이 접근 방식이 얼마나 신뢰할 수 있는지 100 % 확실하지 않습니다.
상자 프레임을 찾으면 다음 단계는 내부에 텍스트가 있는지 확인하는 것입니다. 텍스트 감지는 일반적으로 더 광범위한 문제이며 여러 가지 방법이 있습니다. 다음은 몇 가지 예입니다.
EAST 텍스트 감지기 적용
PixelLink
tesseract (예 : via
pytesseract
) 그러나 잘못된 긍정이 너무 많지 않은지 확실하지 않음상자가 비어 있는지 여부가 더 간단한 경우 내부의 평균 픽셀 값을 확인할 수 있습니다 cv2.countNonZero(). 예 :
- OpenCV를 사용하여 빈 사각형을 식별하는 방법
- OpenCV를 사용하여 검은 색 픽셀 계산
추가 참조 :
- 컨벌루션 신경망을 사용한 사각형 / 사각형 감지에 대한 아이디어