Koordinat teks berbingkai pada gambar

Dec 18 2020

Saya ingin mendapatkan koordinat teks berbingkai pada gambar. Paragraf memiliki batas hitam tipis. Sisa gambar berisi paragraf dan sketsa biasa.

Berikut ini contohnya:

Apakah Anda tahu tentang jenis algoritma apa yang harus saya gunakan dengan Python dengan pustaka gambar untuk mencapai ini? Terima kasih.

Jawaban

2 alecxe Dec 18 2020 at 18:02

Beberapa ide untuk mendeteksi teks berbingkai yang sebagian besar berasal dari kotak pencarian / persegi panjang berukuran besar:

  • temukan kontur dengan OpenCV, analisis bentuk menggunakan algoritma aproksimasi poligon (juga dikenal sebagai algoritma Ramer – Douglas – Peucker ). Anda juga dapat memeriksa rasio aspek kotak pembatas untuk memastikan bentuknya persegi panjang serta memeriksa lebar halaman karena ini tampaknya metrik yang diketahui dalam kasus Anda. PyImageSearch melakukan artikel luar biasa ini:cv2.approxPolyDP()

    • Deteksi bentuk OpenCV
  • Dalam pertanyaan terkait , ada juga saran untuk melihat ke Garis Hough untuk mendeteksi garis horizontal, mengambil giliran mendeteksi garis vertikal dengan cara yang sama. Tidak 100% yakin seberapa andal pendekatan ini.


Setelah Anda menemukan bingkai kotak, langkah selanjutnya adalah memeriksa apakah ada teks di dalamnya. Mendeteksi teks adalah masalah yang lebih luas secara umum dan ada banyak cara untuk melakukannya, berikut beberapa contohnya:

  • terapkan detektor teks EAST

  • PixelLink

  • tesseract (mis. via pytesseract) tetapi tidak yakin apakah ini tidak akan memiliki terlalu banyak positif palsu

  • jika ini adalah kasus sederhana dari kotak yang kosong atau tidak, Anda dapat memeriksa nilai piksel rata-rata di dalamnya - misalnya dengan cv2.countNonZero(). Contoh:

    • Bagaimana mengidentifikasi persegi panjang kosong menggunakan OpenCV
    • Hitung piksel hitam menggunakan OpenCV

Referensi tambahan:

  • ide tentang deteksi segi empat / persegi panjang menggunakan jaringan saraf konvolusional