.Box फ़ाइलें नहीं बना सकते हैं - Tessearct को रोकना

Aug 16 2020

मैं Ubuntu 20.04.1 LTS.I में Tesseract को प्रशिक्षित करने की कोशिश कर रहा हूँ। मैंने tesseract और आवश्यक प्रशिक्षण उपकरण डाउनलोड कर लिए हैं।

प्रशिक्षण डेटा के लिए मैं jTessBoxEditor का उपयोग कर रहा हूं। मेरे पास .tiff फाइलें हैं, लेकिन मैं .box फाइलें बनाने में असमर्थ हूं। जब मैं अपने टर्मिनल में निम्नलिखित टाइप करता हूं:

tesseract --psm 6 --oem 3 Liberation_serif.font.exp0.tif Liberation_serif.font.exp0 makebox

मुझे निम्नलिखित त्रुटि मिलती है:

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

मैंने eng.traineddata को git से डाउनलोड करने और इसे tessdata पर चिपकाने की कोशिश की है। लेकिन मुझे एक ही त्रुटि संदेश मिला। तब मैंने TESSDATA_PREFIX को कई बार बदलकर बिंदु tessdata बनाया, लेकिन मुझे फिर से वही त्रुटि संदेश मिला। मैं इसका कैसे समाधान करूं?

संपादित करें: मेरे द्वारा डाउनलोड किए गए टेसरैक्ट निष्पादन योग्य और टेसरैक्ट स्रोत कोड विभिन्न स्थानों में हैं।

जवाब

Hula Aug 25 2020 at 00:19

मैंने दो स्थानों में टेसरैक्ट डाउनलोड किया। वह स्थान जो TESSDATA_PREFIX को इंगित नहीं कर रहा था। eng.traineddata.I ने इसे गितुब से उस निर्देशिका में डाउनलोड किया और cat >> .pam_environmentउस स्थान पर TESSDATA_PREFIX बिंदु बनाने के लिए फिर से उपयोग किया ।

मैंने फिर से लॉग इन किया और मैं अब .box फाइलें बनाने में सक्षम हूं।