.boxファイルを作成できません-Tessearctのトレーニング

Aug 16 2020

Ubuntu 20.04.1LTSでTesseractをトレーニングしようとしています。tesseractと必要なトレーニングツールをダウンロードしました。

jTessBoxEditorを使用しているトレーニングデータの場合、.tiffファイルはありますが、.boxファイルを作成できません。ターミナルに次のように入力すると:

tesseract --psm 6 --oem 3 Liberation_serif.font.exp0.tif Liberation_serif.font.exp0 makebox

次のエラーが発生します。

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

eng.traineddataをgitからダウンロードしてtessdataに貼り付けようとしましたが、同じエラーメッセージが表示されました。その後、TESSDATA_PREFIXを数回変更してtessdataを指すようにしましたが、同じエラーメッセージが再度表示されました。これを解決するにはどうすればよいですか?

編集:ダウンロードしたtesseract実行可能ファイルとtesseractソースコードは別の場所にあります。

回答

Hula Aug 25 2020 at 00:19

tesseractを2つの場所にダウンロードしました。TESSDATA_PREFIXが指している場所にeng.traineddataがありませんでした。githubからそのディレクトリにダウンロードし、TESSDATA_PREFIXがその場所を指すようにcat >> .pam_environment再度使用しました。

再度ログインすると、.boxファイルを作成できるようになりました。