TIKA - Dosya Biçimleri
Tika Tarafından Desteklenen Dosya Biçimleri
Aşağıdaki tablo Tika'nın desteklediği dosya formatlarını göstermektedir.
Dosya formatı | Paket Kitaplığı | Tika Sınıfı |
---|---|---|
XML | org.apache.tika.parser.xml | XMLParser |
HTML | org.apache.tika.parser.html ve Tagsoup Kitaplığı kullanır | HtmlParser |
MS-Office bileşik belgesi Ole2 2007'ye kadar ooxml 2007'den itibaren | org.apache.tika.parser.microsoft org.apache.tika.parser.microsoft.ooxml ve Apache Poi kitaplığını kullanır |
OfficeParser (ole2) OOXMLParser (ooxml) |
OpenDocument Biçimi openoffice | org.apache.tika.parser.odf | OpenOfficeParser |
taşınabilir Belge Biçimi (PDF) | org.apache.tika.parser.pdf ve bu paket Apache PdfBox kitaplığını kullanır | PDFParser |
Elektronik Yayın Formatı (dijital kitaplar) | org.apache.tika.parser.epub | EpubParser |
Zengin metin formatı | org.apache.tika.parser.rtf | RTFParser |
Sıkıştırma ve paketleme formatları | org.apache.tika.parser.pkg ve bu paket Ortak sıkıştırma kitaplığını kullanır | PackageParser ve CompressorParser ve alt sınıfları |
Metin formatı | org.apache.tika.parser.txt | TXTParser |
Besleme ve sendikasyon biçimleri | org.apache.tika.parser.feed | FeedParser |
Ses formatları | org.apache.tika.parser.audio ve org.apache.tika.parser.mp3 | AudioParser MidiParser Mp3- mp3parser için |
Görüntü ayırıcılar | org.apache.tika.parser.jpeg | JpegParser-için jpeg görüntüleri |
Video biçimleri | org.apache.tika.parser.mp4 ve org.apache.tika.parser.video bu ayrıştırıcı, flash video formatlarını ayrıştırmak için dahili olarak Basit Algoritma kullanır | Mp4parser FlvParser |
java sınıf dosyaları ve jar dosyaları | org.apache.tika.parser.asm | ClassParser CompressorParser |
Mobxformat (e-posta mesajları) | org.apache.tika.parser.mbox | MobXParser |
Cad formatları | org.apache.tika.parser.dwg | DWGParser |
FontFormats | org.apache.tika.parser.font | TrueTypeParser |
çalıştırılabilir programlar ve kitaplıklar | org.apache.tika.parser.executable | ExecutableParser |