TIKA - Środowisko

W tym rozdziale omówiono proces konfiguracji Apache Tika w systemach Windows i Linux. Administracja użytkownikami jest potrzebna podczas instalacji Apache Tika.

wymagania systemowe

JDK Java SE 2 JDK 1.6 lub nowsza
Pamięć 1 GB RAM (zalecane)
Miejsca na dysku Brak minimalnych wymagań
Wersja systemu operacyjnego Windows XP lub nowszy, Linux

Krok 1: weryfikacja instalacji Java

Aby zweryfikować instalację Java, otwórz konsolę i wykonaj następujące czynności java Komenda.

OS Zadanie Komenda
Windows Otwórz konsolę poleceń \> java - wersja
Linux Otwórz terminal poleceń $ java - wersja

Jeśli Java została poprawnie zainstalowana w twoim systemie, powinieneś otrzymać jedno z poniższych danych wyjściowych, w zależności od platformy, na której pracujesz.

OS Wynik
Windows

Wersja Java „1.7.0_60”

Środowisko wykonawcze Java (TM) SE (kompilacja 1.7.0_60-b19)

Java Hotspot (TM) 64-bitowa maszyna wirtualna serwera (wersja 24.60-b09, tryb mieszany)

Lunix

wersja java „1.7.0_25”

Otwórz środowisko wykonawcze JDK (rhel-2.3.10.4.el6_4-x86_64)

Otwórz 64-bitową maszynę wirtualną serwera JDK (kompilacja 23.7-b01, tryb mieszany)

  • Zakładamy, że czytelnicy tego samouczka mają zainstalowaną Javę 1.7.0_60 w swoim systemie, zanim przejdą do tego samouczka.

  • Jeśli nie masz Java SDK, pobierz jego aktualną wersję z https://www.oracle.com/technetwork/java/javase/downloads/index.html and have it installed.

Krok 2: Ustawienie środowiska Java

Ustaw zmienną środowiskową JAVA_HOME tak, aby wskazywała lokalizację katalogu podstawowego, w którym na komputerze jest zainstalowana Java. Na przykład,

OS Wynik
Windows Ustaw zmienną środowiskową JAVA_HOME na C: \ ProgramFiles \ java \ jdk1.7.0_60
Linux eksportuj JAVA_HOME = / usr / local / java-current

Dołącz pełną ścieżkę lokalizacji kompilatora Java do ścieżki systemowej.

OS Wynik
Windows Dołącz ciąg; C: \ Program Files \ Java \ jdk1.7.0_60 \ bin do końca zmiennej systemowej PATH.
Linux export PATH = $ PATH: $ JAVA_HOME / bin /

Sprawdź polecenie wersja-java z wiersza poleceń, jak wyjaśniono powyżej.

Krok 3: Konfiguracja środowiska Apache Tika

Programiści mogą zintegrować Apache Tika ze swoim środowiskiem za pomocą

  • Wiersz poleceń,
  • Tika API,
  • Interfejs linii poleceń (CLI) Tika,
  • Graficzny interfejs użytkownika (GUI) Tika lub
  • kod źródłowy.

W przypadku każdego z tych podejść należy najpierw pobrać kod źródłowy Tika.

Kod źródłowy Tiki znajdziesz pod adresem https://Tika.apache.org/download.html, gdzie znajdziesz dwa linki -

  • apache-tika-1.6-src.zip - Zawiera kod źródłowy Tika i

  • Tika -app-1.6.jar - Jest to plik jar zawierający aplikację Tika.

Pobierz te dwa pliki. Migawka z oficjalnej strony internetowej Tika jest pokazana poniżej.

Po pobraniu plików ustaw ścieżkę klasy dla pliku jar tika-app-1.6.jar. Dodaj pełną ścieżkę do pliku jar, jak pokazano w poniższej tabeli.

OS Wynik
Windows Dołącz ciąg „C: \ jars \ Tika-app-1.6.jar” do zmiennej środowiskowej użytkownika CLASSPATH
Linux

Eksportuj CLASSPATH = $ CLASSPATH -

/usr/share/jars/Tika-app-1.6.tar -

Apache dostarcza aplikację Tika, aplikację z graficznym interfejsem użytkownika (GUI) wykorzystującą Eclipse.

Tika-Maven Buduj za pomocą Eclipse

  • Otwórz Eclipse i utwórz nowy projekt.

  • Jeśli nie masz Mavena w swoim Eclipse, skonfiguruj go, wykonując podane kroki.

    • Otwórz link https://wiki.eclipse.org/M2E_updatesite_and_gittags . Znajdziesz tam wydania wtyczek m2e w formacie tabelarycznym

  • Wybierz najnowszą wersję i zapisz ścieżkę adresu URL w kolumnie p2 url.

  • Teraz wróć do Eclipse, na pasku menu kliknij Helpi wybierz Install New Software z menu rozwijanego

  • Kliknij Addwpisz dowolną nazwę, ponieważ jest opcjonalna. Teraz wklej zapisany adres URL wLocation pole.

  • Zostanie dodana nowa wtyczka o nazwie wybranej w poprzednim kroku, zaznacz pole wyboru przed nią i kliknij Next.

  • Kontynuuj instalację. Po zakończeniu uruchom ponownie Eclipse.

  • Teraz kliknij prawym przyciskiem myszy projekt i w pliku configure wybierz opcję convert to maven project.

  • Pojawi się nowy kreator do tworzenia nowego pom. Wprowadź identyfikator grupy jako org.apache.tika, wprowadź najnowszą wersję Tika, wybierz plikpackaging jako słoik i kliknij Finish.

Projekt Maven został pomyślnie zainstalowany, a projekt jest konwertowany na Maven. Teraz musisz skonfigurować plik pom.xml.

Skonfiguruj plik XML

Pobierz zależność Tika maven zhttps://mvnrepository.com/artifact/org.apache.tika

Poniżej pokazano pełną zależność Apache Tika od Mavena.

<dependency>
   <groupId>org.apache.Tika</groupId>
   <artifactId>Tika-core</artifactId>
   <version>1.6</version>

   <groupId>org.apache.Tika</groupId>
   <artifactId> Tika-parsers</artifactId>
   <version> 1.6</version>

   <groupId> org.apache.Tika</groupId>
   <artifactId>Tika</artifactId>
   <version>1.6</version>

   <groupId>org.apache.Tika</groupId>
   < artifactId>Tika-serialization</artifactId>
   < version>1.6< /version>

   < groupId>org.apache.Tika< /groupId>
   < artifactId>Tika-app< /artifactId>
   < version>1.6< /version>

   <groupId>org.apache.Tika</groupId>
   <artifactId>Tika-bundle</artifactId>
   <version>1.6</version>
</dependency>