Tidak dapat membuat file .box -Training Tessearct

Aug 16 2020

Saya mencoba melatih Tesseract di Ubuntu 20.04.1 LTS. Saya telah mengunduh tesseract dan alat pelatihan yang diperlukan.

Untuk data pelatihan, saya menggunakan jTessBoxEditor. Saya memiliki file .tiff tetapi saya tidak dapat membuat file .box. Saat saya mengetik yang berikut ini di terminal saya:

tesseract --psm 6 --oem 3 Liberation_serif.font.exp0.tif Liberation_serif.font.exp0 makebox

Saya mendapatkan kesalahan berikut:

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

Saya sudah mencoba mendownload eng.traineddata dari git dan menempelkannya ke tessdata. Tapi saya mendapat pesan error yang sama, kemudian saya mengganti TESSDATA_PREFIX beberapa kali untuk menjadikannya tessdata tetapi saya mendapat pesan error yang sama lagi. Bagaimana cara mengatasi ini?

Sunting: Kode sumber tesseract yang dapat dieksekusi dan tesseract yang saya unduh berada di lokasi yang berbeda.

Jawaban

Hula Aug 25 2020 at 00:19

Saya mengunduh tesseract di dua lokasi. Lokasi yang ditunjuk TESSDATA_PREFIX tidak memiliki data pelatihan. Saya mengunduhnya di direktori itu dari github dan menggunakannya cat >> .pam_environmentlagi untuk membuat TESSDATA_PREFIX menunjukkan lokasi itu.

Saya masuk lagi dan saya bisa membuat file .box sekarang.