TIKA - फ़ाइल प्रारूप
फ़ाइल प्रारूप Tika द्वारा समर्थित है
निम्न तालिका फ़ाइल स्वरूपों को दिखाती है, जो Tika समर्थन करता है।
फाइल प्रारूप | पैकेज लाइब्रेरी | टीका में क्लास |
---|---|---|
एक्सएमएल | org.apache.tika.parser.xml | XMLParser |
एचटीएमएल | org.apache.tika.parser.html और यह Tagsoup लाइब्रेरी का उपयोग करता है | HtmlParser |
एमएस-ऑफ़िस कंपाउंड डॉक्यूमेंट Ole2 2007 ओक्सिलम 2007 तक | org.apache.tika.parser.microsoft org.apache.tika.parser.microsoft.ooxml और यह Apache Poi लाइब्रेरी का उपयोग करता है |
OfficeParser (OLE2) OOXMLParser (ओक्सिलम) |
OpenDocument प्रारूप Openoffice | org.apache.tika.parser.odf | OpenOfficeParser |
पोर्टेबल दस्तावेज़ प्रारूप (पीडीएफ) | org.apache.tika.parser.pdf और यह पैकेज Apache PdfBox लाइब्रेरी का उपयोग करता है | PDFParser |
इलेक्ट्रॉनिक प्रकाशन प्रारूप (डिजिटल पुस्तकें) | org.apache.tika.parser.epub | EpubParser |
रिच टेक्स्ट फ़ॉर्मैट | org.apache.tika.parser.rtf | RTFParser |
संपीड़न और पैकेजिंग प्रारूप | org.apache.tika.parser.pkg और यह पैकेज कॉमन कम्प्रेस्स लाइब्रेरी का उपयोग करता है | PackageParser और कंप्रेसरप्रैसर और इसके उप-वर्ग |
पाठ प्रारूप | org.apache.tika.parser.txt | TXTParser |
फ़ीड और सिंडिकेशन प्रारूप | org.apache.tika.parser.feed | FeedParser |
ऑडियो प्रारूप | org.apache.tika.parser.audio और org.apache.tika.parser.mp3 | MP3Pser के लिए AudioParser MidiParser Mp3- |
Imageparsers | org.apache.tika.parser.jpeg | JpegParser-jpeg छवियों के लिए |
Videoformats | org.apache.tika.parser.mp4 और org.apache.tika.parser.video यह पार्सर आंतरिक रूप से फ्लैश वीडियो प्रारूपों को पार्स करने के लिए सरल एल्गोरिथम का उपयोग करता है। | Mp4parser FlvParser |
जावा क्लास फाइलें और जार फाइलें | org.apache.tika.parser.asm | ClassParser कंप्रेसरप्रदर्शक |
Mobxformat (ईमेल संदेश) | org.apache.tika.parser.mbox | MobXParser |
कैड प्रारूप | org.apache.tika.parser.dwg | DWGParser |
FontFormats | org.apache.tika.parser.font | TrueTypeParser |
निष्पादन योग्य कार्यक्रम और पुस्तकालय | org.apache.tika.parser.executable | ExecutableParser |