Bir görüntüdeki çerçeveli metnin koordinatları
Bir resimdeki çerçeveli metnin koordinatlarını almak istiyorum. Paragrafların ince siyah kenarlıkları vardır. Görüntünün geri kalanı, olağan paragraflar ve çizimler içerir.
İşte bir örnek:

Bunu başarmak için Python'da bir görüntü kitaplığıyla birlikte ne tür algoritmalar kullanmam gerektiğine dair bir fikriniz var mı? Teşekkürler.
Yanıtlar
Büyük ölçüde önemli boyuttaki kutuları / dikdörtgenleri aramaktan kaynaklanan çerçeveli bir metni tespit etmek için birkaç fikir:
OpenCV ile konturları bulun, çokgen yaklaşım algoritmasını kullanarak şekilleri analiz edin ( Ramer – Douglas – Peucker algoritması olarak da bilinir ). Ayrıca, şeklin dikdörtgen olduğundan emin olmak için sınırlayıcı kutunun en boy oranını kontrol edebilir ve sizin durumunuzda bilinen bir ölçü gibi göründüğü için sayfa genişliğini kontrol edebilirsiniz. PyImageSearch bu harika makaleyi yaptı:cv2.approxPolyDP()
- OpenCV şekil tespiti
Bir de ilgili soruya , içine bakmak için bir öneri de var Hough Hatları bir dikey çizgileri tespit aynı şekilde çevirmek alarak bir yatay çizgi algılamak için. Bu yaklaşımın ne kadar güvenilir olacağından% 100 emin değilim.
Kutu çerçevelerini bulduğunuzda, sonraki adım, içlerinde herhangi bir metin olup olmadığını kontrol etmektir. Metnin algılanması genel olarak daha geniş bir sorundur ve bunu yapmanın birçok yolu vardır, işte birkaç örnek:
DOĞU metin algılayıcıyı uygula
PixelLink
tesseract (örn. aracılığıyla
pytesseract
), ancak bunun çok fazla yanlış pozitif olup olmayacağından emin değilimeğer kutuların boş olup olmadığı daha basit bir durumsa, içindeki ortalama piksel değerlerini kontrol edebilirsiniz - örn. ile cv2.countNonZero(). Örnekler:
- OpenCV kullanarak boş dikdörtgen nasıl belirlenir
- OpenCV kullanarak siyah pikselleri sayın
Ek referanslar:
- Evrişimli sinir ağlarını kullanarak dörtgen / dikdörtgen algılama üzerine fikirler