TİKA - Çevre

Bu bölüm, Apache Tika'yı Windows ve Linux'ta kurma sürecinde size yol gösterir. Apache Tika'yı yüklerken kullanıcı yönetimi gereklidir.

sistem gereksinimleri

JDK Java SE 2 JDK 1.6 veya üstü
Hafıza 1 GB RAM (önerilen)
Disk alanı Minimum gereklilik yok
İşletim Sistemi Sürümü Windows XP veya üstü, Linux

Adım 1: Java Kurulumunu Doğrulama

Java kurulumunu doğrulamak için konsolu açın ve aşağıdakileri yürütün java komut.

işletim sistemi Görev Komut
pencereler Komut konsolunu aç \> java –sürüm
Linux Komut terminalini aç $ java –version

Java, sisteminize düzgün bir şekilde yüklendiyse, üzerinde çalıştığınız platforma bağlı olarak aşağıdaki çıktılardan birini almalısınız.

işletim sistemi Çıktı
pencereler

Java sürümü "1.7.0_60"

Java (TM) SE Çalışma Zamanı Ortamı (derleme 1.7.0_60-b19)

Java Hotspot (TM) 64-bit Sunucu VM (derleme 24.60-b09, karma mod)

Lunix

java sürümü "1.7.0_25"

JDK Çalışma Zamanı Ortamını açın (rhel-2.3.10.4.el6_4-x86_64)

JDK 64-Bit Sunucu VM'yi açın (23.7-b01 derleme, karma mod)

  • Bu eğiticiye geçmeden önce bu eğiticinin okuyucularının sistemlerinde Java 1.7.0_60 yüklü olduğunu varsayıyoruz.

  • Java SDK'nız yoksa, mevcut sürümünü şuradan indirin: https://www.oracle.com/technetwork/java/javase/downloads/index.html and have it installed.

Adım 2: Java Ortamını Ayarlama

JAVA_HOME ortam değişkenini, Java'nın makinenizde kurulu olduğu temel dizin konumunu gösterecek şekilde ayarlayın. Örneğin,

işletim sistemi Çıktı
pencereler Çevresel değişken JAVA_HOME'u C: \ ProgramFiles \ java \ jdk1.7.0_60 olarak ayarlayın
Linux dışa aktar JAVA_HOME = / usr / local / java-current

Java derleyici konumunun tam yolunu Sistem Yoluna ekleyin.

işletim sistemi Çıktı
pencereler Dizeyi Ekle; C: \ Program Files \ Java \ jdk1.7.0_60 \ bin PATH sistem değişkeninin sonuna.
Linux dışa aktar PATH = $ PATH: $ JAVA_HOME / bin /

Yukarıda açıklandığı gibi komut isteminden java sürümü komutunu doğrulayın.

Adım 3: Apache Tika Ortamını Kurma

Programcılar, Apache Tika'yı ortamlarına entegre edebilirler.

  • Komut satırı,
  • Tika API,
  • Tika'nın komut satırı arayüzü (CLI),
  • Tika'nın Grafik Kullanıcı arabirimi (GUI) veya
  • kaynak kodu.

Bu yaklaşımlardan herhangi biri için öncelikle Tika'nın kaynak kodunu indirmelisiniz.

Tika'nın kaynak kodunu şu adreste bulabilirsiniz: https://Tika.apache.org/download.html, iki bağlantı bulacaksınız -

  • apache-tika-1.6-src.zip - Tika'nın kaynak kodunu içerir ve

  • Tika -app-1.6.jar - Tika uygulamasını içeren bir jar dosyasıdır.

Bu iki dosyayı indirin. Tika'nın resmi web sitesinin bir anlık görüntüsü aşağıda gösterilmektedir.

Dosyaları indirdikten sonra, jar dosyası için sınıf yolunu ayarlayın tika-app-1.6.jar. Aşağıdaki tabloda gösterildiği gibi, jar dosyasının tam yolunu ekleyin.

işletim sistemi Çıktı
pencereler "C: \ jars \ Tika-app-1.6.jar" Dizesini CLASSPATH kullanıcı ortam değişkenine ekleyin
Linux

Dışa Aktar CLASSPATH = $ CLASSPATH -

/usr/share/jars/Tika-app-1.6.tar -

Apache, Eclipse kullanan bir Grafik Kullanıcı Arayüzü (GUI) uygulaması olan Tika uygulamasını sağlar.

Eclipse kullanarak Tika-Maven Build

  • Tutulmayı açın ve yeni bir proje oluşturun.

  • Eclipse'inizde Maven yoksa, verilen adımları izleyerek kurun.

    • Https://wiki.eclipse.org/M2E_updatesite_and_gittags bağlantısını açın . Orada m2e eklenti sürümlerini tablo biçiminde bulacaksınız.

  • En son sürümü seçin ve url'nin yolunu p2 url sütununa kaydedin.

  • Şimdi tutulmayı tekrar ziyaret edin, menü çubuğunda Help, ve Seç Install New Software açılır menüden

  • Tıkla Adddüğmesine isteğe bağlı olduğundan istediğiniz adı yazın. Şimdi kaydedilen url'yi şuraya yapıştırın:Location alan.

  • Önceki adımda seçtiğiniz adla yeni bir eklenti eklenecek, önündeki onay kutusunu işaretleyin ve tıklayın Next.

  • Kuruluma devam edin. Tamamlandığında, Eclipse'i yeniden başlatın.

  • Şimdi projeye sağ tıklayın ve configure seçenek, seçin convert to maven project.

  • Yeni bir pom oluşturmak için yeni bir sihirbaz belirir. Grup Kimliğini org.apache.tika olarak girin, Tika'nın en son sürümünü girin,packaging kavanoz olarak ve tıklayın Finish.

Maven projesi başarıyla yüklendi ve projeniz Maven'e dönüştürüldü. Şimdi pom.xml dosyasını yapılandırmanız gerekiyor.

XML Dosyasını Yapılandırın

Tika maven bağımlılığını buradan alınhttps://mvnrepository.com/artifact/org.apache.tika

Aşağıda, Apache Tika'nın tam Maven bağımlılığı gösterilmektedir.

<dependency>
   <groupId>org.apache.Tika</groupId>
   <artifactId>Tika-core</artifactId>
   <version>1.6</version>

   <groupId>org.apache.Tika</groupId>
   <artifactId> Tika-parsers</artifactId>
   <version> 1.6</version>

   <groupId> org.apache.Tika</groupId>
   <artifactId>Tika</artifactId>
   <version>1.6</version>

   <groupId>org.apache.Tika</groupId>
   < artifactId>Tika-serialization</artifactId>
   < version>1.6< /version>

   < groupId>org.apache.Tika< /groupId>
   < artifactId>Tika-app< /artifactId>
   < version>1.6< /version>

   <groupId>org.apache.Tika</groupId>
   <artifactId>Tika-bundle</artifactId>
   <version>1.6</version>
</dependency>