.Box dosyaları yapılamıyor -Training Tessearct

Aug 16 2020

Tesseract'ı Ubuntu 20.04.1 LTS'de eğitmeye çalışıyorum. Tesseract ve gerekli eğitim araçlarını indirdim.

Eğitim verileri için jTessBoxEditor kullanıyorum ... tiff dosyalarım var ama .box dosyalarını yapamıyorum Terminalimde aşağıdakileri yazdığımda:

tesseract --psm 6 --oem 3 Liberation_serif.font.exp0.tif Liberation_serif.font.exp0 makebox

Şu hatayı alıyorum:

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

Git'ten eng.traineddata dosyasını indirmeyi ve tessdata'ya yapıştırmayı denedim ama aynı hata mesajını aldım.Sonra TESSDATA_PREFIX'i tessdata'yı göstermesi için birkaç kez değiştirdim ama aynı hata mesajını tekrar aldım. Bunu nasıl çözerim?

Düzenleme: İndirdiğim tesseract çalıştırılabilir ve tesseract kaynak kodu farklı yerlerde.

Yanıtlar

Hula Aug 25 2020 at 00:19

Tesseract'ı iki lokasyonda indirdim.TESSDATA_PREFIX'in işaret ettiği lokasyon eng.traineddata'ya sahip değildi.Github'dan o dizine cat >> .pam_environmentindirdim ve TESSDATA_PREFIX'i o lokasyonu işaret etmek için tekrar kullandım .

Tekrar giriş yaptım ve şimdi .box dosyaları oluşturabiliyorum.