TIKA - Środowisko
W tym rozdziale omówiono proces konfiguracji Apache Tika w systemach Windows i Linux. Administracja użytkownikami jest potrzebna podczas instalacji Apache Tika.
wymagania systemowe
JDK | Java SE 2 JDK 1.6 lub nowsza |
Pamięć | 1 GB RAM (zalecane) |
Miejsca na dysku | Brak minimalnych wymagań |
Wersja systemu operacyjnego | Windows XP lub nowszy, Linux |
Krok 1: weryfikacja instalacji Java
Aby zweryfikować instalację Java, otwórz konsolę i wykonaj następujące czynności java Komenda.
OS | Zadanie | Komenda |
---|---|---|
Windows | Otwórz konsolę poleceń | \> java - wersja |
Linux | Otwórz terminal poleceń | $ java - wersja |
Jeśli Java została poprawnie zainstalowana w twoim systemie, powinieneś otrzymać jedno z poniższych danych wyjściowych, w zależności od platformy, na której pracujesz.
OS | Wynik |
---|---|
Windows | Wersja Java „1.7.0_60”
Środowisko wykonawcze Java (TM) SE (kompilacja 1.7.0_60-b19) Java Hotspot (TM) 64-bitowa maszyna wirtualna serwera (wersja 24.60-b09, tryb mieszany) |
Lunix | wersja java „1.7.0_25” Otwórz środowisko wykonawcze JDK (rhel-2.3.10.4.el6_4-x86_64) Otwórz 64-bitową maszynę wirtualną serwera JDK (kompilacja 23.7-b01, tryb mieszany) |
Zakładamy, że czytelnicy tego samouczka mają zainstalowaną Javę 1.7.0_60 w swoim systemie, zanim przejdą do tego samouczka.
Jeśli nie masz Java SDK, pobierz jego aktualną wersję z https://www.oracle.com/technetwork/java/javase/downloads/index.html and have it installed.
Krok 2: Ustawienie środowiska Java
Ustaw zmienną środowiskową JAVA_HOME tak, aby wskazywała lokalizację katalogu podstawowego, w którym na komputerze jest zainstalowana Java. Na przykład,
OS | Wynik |
---|---|
Windows | Ustaw zmienną środowiskową JAVA_HOME na C: \ ProgramFiles \ java \ jdk1.7.0_60 |
Linux | eksportuj JAVA_HOME = / usr / local / java-current |
Dołącz pełną ścieżkę lokalizacji kompilatora Java do ścieżki systemowej.
OS | Wynik |
---|---|
Windows | Dołącz ciąg; C: \ Program Files \ Java \ jdk1.7.0_60 \ bin do końca zmiennej systemowej PATH. |
Linux | export PATH = $ PATH: $ JAVA_HOME / bin / |
Sprawdź polecenie wersja-java z wiersza poleceń, jak wyjaśniono powyżej.
Krok 3: Konfiguracja środowiska Apache Tika
Programiści mogą zintegrować Apache Tika ze swoim środowiskiem za pomocą
- Wiersz poleceń,
- Tika API,
- Interfejs linii poleceń (CLI) Tika,
- Graficzny interfejs użytkownika (GUI) Tika lub
- kod źródłowy.
W przypadku każdego z tych podejść należy najpierw pobrać kod źródłowy Tika.
Kod źródłowy Tiki znajdziesz pod adresem https://Tika.apache.org/download.html, gdzie znajdziesz dwa linki -
apache-tika-1.6-src.zip - Zawiera kod źródłowy Tika i
Tika -app-1.6.jar - Jest to plik jar zawierający aplikację Tika.
Pobierz te dwa pliki. Migawka z oficjalnej strony internetowej Tika jest pokazana poniżej.
Po pobraniu plików ustaw ścieżkę klasy dla pliku jar tika-app-1.6.jar. Dodaj pełną ścieżkę do pliku jar, jak pokazano w poniższej tabeli.
OS | Wynik |
---|---|
Windows | Dołącz ciąg „C: \ jars \ Tika-app-1.6.jar” do zmiennej środowiskowej użytkownika CLASSPATH |
Linux | Eksportuj CLASSPATH = $ CLASSPATH - /usr/share/jars/Tika-app-1.6.tar - |
Apache dostarcza aplikację Tika, aplikację z graficznym interfejsem użytkownika (GUI) wykorzystującą Eclipse.
Tika-Maven Buduj za pomocą Eclipse
Otwórz Eclipse i utwórz nowy projekt.
Jeśli nie masz Mavena w swoim Eclipse, skonfiguruj go, wykonując podane kroki.
Otwórz link https://wiki.eclipse.org/M2E_updatesite_and_gittags . Znajdziesz tam wydania wtyczek m2e w formacie tabelarycznym
Wybierz najnowszą wersję i zapisz ścieżkę adresu URL w kolumnie p2 url.
Teraz wróć do Eclipse, na pasku menu kliknij Helpi wybierz Install New Software z menu rozwijanego
Kliknij Addwpisz dowolną nazwę, ponieważ jest opcjonalna. Teraz wklej zapisany adres URL wLocation pole.
Zostanie dodana nowa wtyczka o nazwie wybranej w poprzednim kroku, zaznacz pole wyboru przed nią i kliknij Next.
Kontynuuj instalację. Po zakończeniu uruchom ponownie Eclipse.
Teraz kliknij prawym przyciskiem myszy projekt i w pliku configure wybierz opcję convert to maven project.
Pojawi się nowy kreator do tworzenia nowego pom. Wprowadź identyfikator grupy jako org.apache.tika, wprowadź najnowszą wersję Tika, wybierz plikpackaging jako słoik i kliknij Finish.
Projekt Maven został pomyślnie zainstalowany, a projekt jest konwertowany na Maven. Teraz musisz skonfigurować plik pom.xml.
Skonfiguruj plik XML
Pobierz zależność Tika maven zhttps://mvnrepository.com/artifact/org.apache.tika
Poniżej pokazano pełną zależność Apache Tika od Mavena.
<dependency>
<groupId>org.apache.Tika</groupId>
<artifactId>Tika-core</artifactId>
<version>1.6</version>
<groupId>org.apache.Tika</groupId>
<artifactId> Tika-parsers</artifactId>
<version> 1.6</version>
<groupId> org.apache.Tika</groupId>
<artifactId>Tika</artifactId>
<version>1.6</version>
<groupId>org.apache.Tika</groupId>
< artifactId>Tika-serialization</artifactId>
< version>1.6< /version>
< groupId>org.apache.Tika< /groupId>
< artifactId>Tika-app< /artifactId>
< version>1.6< /version>
<groupId>org.apache.Tika</groupId>
<artifactId>Tika-bundle</artifactId>
<version>1.6</version>
</dependency>