Lucene-インデックスクラス

インデックス作成プロセスは、Luceneが提供するコア機能の1つです。次の図は、インデックス作成プロセスとクラスの使用法を示しています。IndexWriter は、インデックス作成プロセスの最も重要でコアコンポーネントです。

我々が追加します Document(s) 含む Field(s) を分析するIndexWriterへ Document(s) を使用して Analyzer 次に、必要に応じてインデックスを作成/オープン/編集し、インデックスを保存/更新します。 Directory。IndexWriterは、インデックスを更新または作成するために使用されます。インデックスの読み取りには使用されません。

クラスのインデックス作成

以下は、インデックス作成プロセス中に一般的に使用されるクラスのリストです。

S.No. クラスと説明
1 IndexWriter

このクラスは、インデックス作成プロセス中にインデックスを作成/更新するコアコンポーネントとして機能します。

2 ディレクトリ

このクラスは、インデックスの保存場所を表します。

3 アナライザ

このクラスは、ドキュメントを分析し、インデックスを作成するテキストからトークン/単語を取得する役割を果たします。分析が行われないと、IndexWriterはインデックスを作成できません。

4 資料

このクラスは、Fieldsを持つ仮想ドキュメントを表します。ここで、Fieldは、物理ドキュメントのコンテンツ、そのメタデータなどを含むことができるオブジェクトです。アナライザーはドキュメントのみを理解できます。

5 フィールド

これは、インデックス作成プロセスの最小単位または開始点です。これは、キーがインデックス付けされる値を識別するために使用されるキーと値のペアの関係を表します。ドキュメントのコンテンツを表すために使用されるフィールドが「コンテンツ」としてキーを持ち、値にドキュメントのテキストまたは数値コンテンツの一部またはすべてが含まれる場合があると仮定します。Luceneは、テキストまたは数値コンテンツのみにインデックスを付けることができます。