Koordinat teks berbingkai pada gambar
Saya ingin mendapatkan koordinat teks berbingkai pada gambar. Paragraf memiliki batas hitam tipis. Sisa gambar berisi paragraf dan sketsa biasa.
Berikut ini contohnya:
Apakah Anda tahu tentang jenis algoritma apa yang harus saya gunakan dengan Python dengan pustaka gambar untuk mencapai ini? Terima kasih.
Jawaban
Beberapa ide untuk mendeteksi teks berbingkai yang sebagian besar berasal dari kotak pencarian / persegi panjang berukuran besar:
temukan kontur dengan OpenCV, analisis bentuk menggunakan algoritma aproksimasi poligon (juga dikenal sebagai algoritma Ramer – Douglas – Peucker ). Anda juga dapat memeriksa rasio aspek kotak pembatas untuk memastikan bentuknya persegi panjang serta memeriksa lebar halaman karena ini tampaknya metrik yang diketahui dalam kasus Anda. PyImageSearch melakukan artikel luar biasa ini:cv2.approxPolyDP()
- Deteksi bentuk OpenCV
Dalam pertanyaan terkait , ada juga saran untuk melihat ke Garis Hough untuk mendeteksi garis horizontal, mengambil giliran mendeteksi garis vertikal dengan cara yang sama. Tidak 100% yakin seberapa andal pendekatan ini.
Setelah Anda menemukan bingkai kotak, langkah selanjutnya adalah memeriksa apakah ada teks di dalamnya. Mendeteksi teks adalah masalah yang lebih luas secara umum dan ada banyak cara untuk melakukannya, berikut beberapa contohnya:
terapkan detektor teks EAST
PixelLink
tesseract (mis. via
pytesseract
) tetapi tidak yakin apakah ini tidak akan memiliki terlalu banyak positif palsujika ini adalah kasus sederhana dari kotak yang kosong atau tidak, Anda dapat memeriksa nilai piksel rata-rata di dalamnya - misalnya dengan cv2.countNonZero(). Contoh:
- Bagaimana mengidentifikasi persegi panjang kosong menggunakan OpenCV
- Hitung piksel hitam menggunakan OpenCV
Referensi tambahan:
- ide tentang deteksi segi empat / persegi panjang menggunakan jaringan saraf konvolusional