TIKA-環境
この章では、WindowsおよびLinuxでApacheTikaをセットアップするプロセスについて説明します。Apache Tikaのインストール中は、ユーザー管理が必要です。
システム要求
JDK | Java SE 2 JDK1.6以降 |
記憶 | 1 GB RAM(推奨) |
ディスクスペース | 最小要件はありません |
オペレーティングシステムのバージョン | Windows XP以降、Linux |
ステップ1:Javaインストールの確認
Javaのインストールを確認するには、コンソールを開いて以下を実行します java コマンド。
OS | 仕事 | コマンド |
---|---|---|
ウィンドウズ | コマンドコンソールを開く | \> java –version |
Linux | コマンドターミナルを開く | $ java –version |
Javaがシステムに正しくインストールされている場合は、作業しているプラットフォームに応じて、次のいずれかの出力が得られるはずです。
OS | 出力 |
---|---|
ウィンドウズ | Javaバージョン「1.7.0_60」
Java(TM)SEランタイム環境(ビルド1.7.0_60-b19) Java Hotspot(TM)64ビットサーバーVM(ビルド24.60-b09、混合モード) |
ルニックス | Javaバージョン「1.7.0_25」 JDKランタイム環境を開きます(rhel-2.3.10.4.el6_4-x86_64) JDK 64ビットサーバーVMを開きます(ビルド23.7-b01、混合モード) |
このチュートリアルの読者は、このチュートリアルに進む前に、システムにJava1.7.0_60がインストールされていることを前提としています。
Java SDKをお持ちでない場合は、現在のバージョンをからダウンロードしてください。 https://www.oracle.com/technetwork/java/javase/downloads/index.html and have it installed。
ステップ2:Java環境を設定する
Javaがマシンにインストールされているベースディレクトリの場所を指すように、JAVA_HOME環境変数を設定します。例えば、
OS | 出力 |
---|---|
ウィンドウズ | 環境変数JAVA_HOMEをC:\ ProgramFiles \ java \ jdk1.7.0_60に設定します |
Linux | export JAVA_HOME = / usr / local / java-current |
Javaコンパイラの場所のフルパスをシステムパスに追加します。
OS | 出力 |
---|---|
ウィンドウズ | 文字列を追加します。C:\ Program Files \ Java \ jdk1.7.0_60 \ binをシステム変数PATHの最後に追加します。 |
Linux | export PATH = $ PATH:$ JAVA_HOME / bin / |
上で説明したように、コマンドプロンプトからコマンドjava-versionを確認します。
ステップ3:ApacheTika環境をセットアップする
プログラマーは、以下を使用して、ApacheTikaを環境に統合できます。
- コマンドライン、
- Tika API、
- Tikaのコマンドラインインターフェイス(CLI)、
- Tikaのグラフィカルユーザーインターフェイス(GUI)、または
- ソースコード。
これらのアプローチのいずれについても、まず、Tikaのソースコードをダウンロードする必要があります。
Tikaのソースコードは次の場所にあります。 https://Tika.apache.org/download.html, 2つのリンクがあります-
apache-tika-1.6-src.zip − Tikaのソースコードが含まれており、
Tika -app-1.6.jar −Tikaアプリケーションを含むjarファイルです。
これらの2つのファイルをダウンロードします。ティカの公式サイトのスナップショットを以下に示します。

ファイルをダウンロードした後、jarファイルのクラスパスを設定します tika-app-1.6.jar。次の表に示すように、jarファイルの完全なパスを追加します。
OS | 出力 |
---|---|
ウィンドウズ | 文字列「C:\ jars \ Tika-app-1.6.jar」をユーザー環境変数CLASSPATHに追加します |
Linux | エクスポートCLASSPATH = $ CLASSPATH − /usr/share/jars/Tika-app-1.6.tar − |
Apacheは、Eclipseを使用したグラフィカルユーザーインターフェイス(GUI)アプリケーションであるTikaアプリケーションを提供します。
Eclipseを使用したTika-Mavenビルド
Eclipseを開き、新しいプロジェクトを作成します。
EclipseにMavenがない場合は、所定の手順に従って設定してください。
リンクhttps://wiki.eclipse.org/M2E_updatesite_and_gittagsを開きます。そこに表形式のm2eプラグインリリースがあります

最新バージョンを選択し、URLのパスをp2url列に保存します。
今度は日食に戻り、メニューバーでクリックします Help、を選択します Install New Software ドロップダウンメニューから

クリック Addボタンをクリックし、オプションであるため、任意の名前を入力します。保存したURLをに貼り付けますLocation フィールド。
前の手順で選択した名前の新しいプラグインが追加されます。その前にあるチェックボックスをオンにして、[ Next。

インストールを続行します。完了したら、Eclipseを再起動します。
次に、プロジェクトを右クリックし、 configure オプション、選択 convert to maven project。
新しいpomを作成するための新しいウィザードが表示されます。グループIDをorg.apache.tikaとして入力し、Tikaの最新バージョンを入力して、packaging jarとして、クリックします Finish。
Mavenプロジェクトが正常にインストールされ、プロジェクトがMavenに変換されます。次に、pom.xmlファイルを構成する必要があります。
XMLファイルを構成します
からTikaMavenの依存関係を取得しますhttps://mvnrepository.com/artifact/org.apache.tika
以下に示すのは、ApacheTikaの完全なMaven依存関係です。
<dependency>
<groupId>org.apache.Tika</groupId>
<artifactId>Tika-core</artifactId>
<version>1.6</version>
<groupId>org.apache.Tika</groupId>
<artifactId> Tika-parsers</artifactId>
<version> 1.6</version>
<groupId> org.apache.Tika</groupId>
<artifactId>Tika</artifactId>
<version>1.6</version>
<groupId>org.apache.Tika</groupId>
< artifactId>Tika-serialization</artifactId>
< version>1.6< /version>
< groupId>org.apache.Tika< /groupId>
< artifactId>Tika-app< /artifactId>
< version>1.6< /version>
<groupId>org.apache.Tika</groupId>
<artifactId>Tika-bundle</artifactId>
<version>1.6</version>
</dependency>