Impossible de créer des fichiers .box -Training Tessearct

Aug 16 2020

J'essaie de former Tesseract à Ubuntu 20.04.1 LTS, j'ai téléchargé tesseract et les outils de formation nécessaires.

Pour les données d'entraînement, j'utilise jTessBoxEditor, j'ai les fichiers .tiff mais je ne peux pas créer les fichiers .box.Lorsque je tape ce qui suit dans mon terminal:

tesseract --psm 6 --oem 3 Liberation_serif.font.exp0.tif Liberation_serif.font.exp0 makebox

J'obtiens l'erreur suivante:

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

J'ai essayé de télécharger eng.traineddata à partir de git et de le coller dans tessdata.Mais j'ai eu le même message d'erreur.Ensuite, j'ai changé TESSDATA_PREFIX plusieurs fois pour le faire pointer tessdata mais j'ai à nouveau le même message d'erreur. Comment résoudre ça?

Edit: L'exécutable tesseract et le code source tesseract que j'ai téléchargé se trouvent à des emplacements différents.

Réponses

Hula Aug 25 2020 at 00:19

J'ai téléchargé tesseract à deux endroits.L'emplacement vers lequel TESSDATA_PREFIX pointait n'avait pas eng.traineddata.Je l'ai téléchargé dans ce répertoire à partir de github et utilisé à cat >> .pam_environmentnouveau pour que TESSDATA_PREFIX pointe vers cet emplacement.

Je me suis reconnecté et je peux maintenant créer des fichiers .box.