TIKA - पर्यावरण

यह अध्याय आपको Windows और Linux पर Apache Tika स्थापित करने की प्रक्रिया के माध्यम से ले जाता है। Apache Tika स्थापित करते समय उपयोगकर्ता प्रशासन की आवश्यकता है।

सिस्टम आवश्यकताएं

JDK जावा एसई 2 जेडडीके 1.6 या इसके बाद के संस्करण
याद 1 जीबी रैम (अनुशंसित)
डिस्क में जगह कोई न्यूनतम आवश्यकता नहीं
ऑपरेटिंग सिस्टम संस्करण विंडोज एक्सपी या उससे ऊपर, लिनक्स

चरण 1: जावा स्थापना का सत्यापन

जावा इंस्टॉलेशन को सत्यापित करने के लिए, कंसोल खोलें और निम्नलिखित को निष्पादित करें java आदेश।

ओएस टास्क आदेश
खिड़कियाँ कमांड कंसोल खोलें \> जावा-विसर्जन
लिनक्स ओपन कमांड टर्मिनल $ जावा-विसर्जन

यदि जावा आपके सिस्टम पर ठीक से स्थापित किया गया है, तो आपको उस प्लेटफॉर्म के आधार पर निम्न आउटपुट में से एक प्राप्त करना चाहिए, जिस पर आप काम कर रहे हैं।

ओएस उत्पादन
खिड़कियाँ

जावा संस्करण "1.7.0_60"

जावा (टीएम) एसई रन टाइम एनवायरनमेंट (बिल्ड 1.7.0_60-b19)

जावा हॉटस्पॉट (TM) 64-बिट सर्वर VM (24.60-b09, मिश्रित मोड का निर्माण)

Lunix

जावा संस्करण "1.7.0_25"

ओपन JDK रनटाइम एनवायरनमेंट (rhel-2.3.10.4.el6_4-x86_64)

ओपन JDK 64-बिट सर्वर VM (बिल्ड 23.7-b01, मिश्रित मोड)

  • हम इस ट्यूटोरियल के पाठकों को इस ट्यूटोरियल के लिए आगे बढ़ने से पहले अपने सिस्टम पर जावा 1.7.0_60 स्थापित करते हैं।

  • यदि आपके पास जावा एसडीके नहीं है, तो इसका वर्तमान संस्करण डाउनलोड करें https://www.oracle.com/technetwork/java/javase/downloads/index.html and have it installed।

चरण 2: जावा पर्यावरण की स्थापना

आधार निर्देशिका स्थान पर इंगित करने के लिए JAVA_HOME पर्यावरण चर सेट करें जहाँ जावा आपकी मशीन पर स्थापित है। उदाहरण के लिए,

ओएस उत्पादन
खिड़कियाँ पर्यावरण चर JAVA_HOME को C: \ ProgramFiles \ java \ jdk1.7.0_60 पर सेट करें
लिनक्स निर्यात JAVA_HOME = / usr / स्थानीय / जावा-वर्तमान

जावा कंपाइलर स्थान का पूरा पथ सिस्टम पथ में जोड़ें।

ओएस उत्पादन
खिड़कियाँ स्ट्रिंग को जोड़ो; C: \ Program Files \ Java \ jdk1.7.0_60 \ bin सिस्टम चर पथ के अंत में।
लिनक्स निर्यात पथ = $ पथ: $ जाव_होम / बिन /

ऊपर बताए अनुसार कमांड प्रॉम्प्ट से कमांड जावा-संस्करण सत्यापित करें।

चरण 3: अपाचे टीका पर्यावरण की स्थापना

प्रोग्रामर Apache Tika को अपने वातावरण में उपयोग करके एकीकृत कर सकते हैं

  • कमांड लाइन,
  • टिक एपीआई,
  • Tika की कमांड लाइन इंटरफ़ेस (CLI),
  • Tika का ग्राफिकल यूजर इंटरफेस (GUI), या
  • स्रोत कोड।

इनमें से किसी भी दृष्टिकोण के लिए, सबसे पहले, आपको टिक का स्रोत कोड डाउनलोड करना होगा।

आपको Tika का स्रोत कोड मिल जाएगा https://Tika.apache.org/download.html, जहां आपको दो लिंक मिलेंगे -

  • apache-tika-1.6-src.zip - इसमें टीका का स्रोत कोड है, और

  • Tika -app-1.6.jar - यह एक जार फाइल है जिसमें टिक एप्लीकेशन है।

इन दो फाइलों को डाउनलोड करें। टीका की आधिकारिक वेबसाइट का एक स्नैपशॉट नीचे दिखाया गया है।

फ़ाइलों को डाउनलोड करने के बाद, जार फ़ाइल के लिए classpath सेट करें tika-app-1.6.jar। जार फ़ाइल का पूरा पथ नीचे दी गई तालिका में दिखाया गया है।

ओएस उत्पादन
खिड़कियाँ स्ट्रिंग "C: \ jars \ Tika-app-1.6.jar" को उपयोगकर्ता पर्यावरण चर CLASSPATH में जोड़ें
लिनक्स

निर्यात क्लास = $ क्लास -

/usr/share/jars/Tika-app-1.6.tar -

अपाचे टीका एप्लिकेशन, एक ग्राफिकल यूजर इंटरफेस (जीयूआई) एप्लिकेशन का उपयोग करके प्रदान करता है।

Tika-Maven ग्रहण का उपयोग कर निर्माण करें

  • ग्रहण खोलें और एक नया प्रोजेक्ट बनाएं।

  • यदि आपके ग्रहण में मावेन नहीं है, तो दिए गए चरणों का पालन करके इसे स्थापित करें।

    • लिंक https://wiki.eclipse.org/M2E_updatesite_and_gittags खोलें । वहां आपको एक टेबुलर फॉर्मेट में एम 2 ओ प्लगइन रिलीज मिलेगा

  • लेटेस्ट वर्जन चुनें और url का रास्ता P2 url कॉलम में सेव करें।

  • अब मेनू बार में ग्रहण को फिर से देखें Help, और चुनें Install New Software ड्रॉपडाउन मेनू से

  • दबाएं Addबटन, किसी भी वांछित नाम को टाइप करें, क्योंकि यह वैकल्पिक है। अब सेव किए हुए url को इसमें पेस्ट करेंLocation मैदान।

  • पिछले चरण में आपके द्वारा चुने गए नाम के साथ एक नया प्लगइन जोड़ा जाएगा, इसके सामने चेकबॉक्स की जांच करें, और क्लिक करें Next

  • स्थापना के साथ आगे बढ़ें। एक बार पूरा होने के बाद, ग्रहण को फिर से शुरू करें।

  • अब प्रोजेक्ट पर राइट क्लिक करें, और में configure विकल्प, चयन करें convert to maven project

  • एक नया पोम बनाने के लिए एक नया विज़ार्ड दिखाई देता है। Group Id को org.apache.tika के रूप में दर्ज करें, Tika का नवीनतम संस्करण दर्ज करें, चुनेंpackaging जार के रूप में, और क्लिक करें Finish

मावेन परियोजना सफलतापूर्वक स्थापित है, और आपकी परियोजना मावेन में बदल जाती है। अब आपको pom.xml फ़ाइल को कॉन्फ़िगर करना होगा।

XML फ़ाइल कॉन्फ़िगर करें

टीका मावेन निर्भरता से प्राप्त करेंhttps://mvnrepository.com/artifact/org.apache.tika

नीचे दिखाया गया है अपाचे टीका का पूरा मावेन निर्भरता है।

<dependency>
   <groupId>org.apache.Tika</groupId>
   <artifactId>Tika-core</artifactId>
   <version>1.6</version>

   <groupId>org.apache.Tika</groupId>
   <artifactId> Tika-parsers</artifactId>
   <version> 1.6</version>

   <groupId> org.apache.Tika</groupId>
   <artifactId>Tika</artifactId>
   <version>1.6</version>

   <groupId>org.apache.Tika</groupId>
   < artifactId>Tika-serialization</artifactId>
   < version>1.6< /version>

   < groupId>org.apache.Tika< /groupId>
   < artifactId>Tika-app< /artifactId>
   < version>1.6< /version>

   <groupId>org.apache.Tika</groupId>
   <artifactId>Tika-bundle</artifactId>
   <version>1.6</version>
</dependency>