Lucene-検索操作
検索のプロセスは、Luceneが提供するコア機能の1つです。次の図は、プロセスとその使用法を示しています。IndexSearcherは、検索プロセスのコアコンポーネントの1つです。
最初にインデックスを含むディレクトリを作成し、それをIndexSearcherに渡します。IndexSearcherはIndexReaderを使用してディレクトリを開きます。その後、我々は、作成するクエリをして用語と使用して検索しますIndexSearcherを渡すことで、クエリを検索者に。IndexSearcherは、検索の詳細と、検索操作の結果であるドキュメントのドキュメントIDを含むTopDocsオブジェクトを返します。
ここでは、段階的なアプローチを示し、基本的な例を使用してインデックス作成プロセスを理解するのに役立ちます。
QueryParserを作成する
QueryParserクラスは、ユーザーが入力した入力をLuceneが理解できる形式のクエリに解析します。次の手順に従って、QueryParserを作成します-
Step 1 −QueryParserのオブジェクトを作成します。
Step 2 −このクエリを実行するバージョン情報とインデックス名を持つ標準アナライザで作成されたQueryParserオブジェクトを初期化します。
QueryParser queryParser;
public Searcher(String indexDirectoryPath) throws IOException {
queryParser = new QueryParser(Version.LUCENE_36,
LuceneConstants.CONTENTS,
new StandardAnalyzer(Version.LUCENE_36));
}
IndexSearcherを作成する
IndexSearcherクラスは、インデックス作成プロセス中に作成された検索者インデックスのコアコンポーネントとして機能します。次の手順に従って、IndexSearcherを作成します-
Step 1 −IndexSearcherのオブジェクトを作成します。
Step 2 −インデックスが保存される場所を指すLuceneディレクトリを作成します。
Step 3 −インデックスディレクトリで作成されたIndexSearcherオブジェクトを初期化します。
IndexSearcher indexSearcher;
public Searcher(String indexDirectoryPath) throws IOException {
Directory indexDirectory =
FSDirectory.open(new File(indexDirectoryPath));
indexSearcher = new IndexSearcher(indexDirectory);
}
検索する
次の手順に従って検索を行います-
Step 1 − QueryParserを介して検索式を解析することにより、Queryオブジェクトを作成します。
Step 2 − IndexSearcher.search()メソッドを呼び出して検索を行います。
Query query;
public TopDocs search( String searchQuery) throws IOException, ParseException {
query = queryParser.parse(searchQuery);
return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
}
ドキュメントを入手する
次のプログラムは、ドキュメントを取得する方法を示しています。
public Document getDocument(ScoreDoc scoreDoc)
throws CorruptIndexException, IOException {
return indexSearcher.doc(scoreDoc.doc);
}
IndexSearcherを閉じる
次のプログラムは、IndexSearcherを閉じる方法を示しています。
public void close() throws IOException {
indexSearcher.close();
}
アプリケーション例
検索プロセスをテストするためのテストLuceneアプリケーションを作成しましょう。
ステップ | 説明 |
---|---|
1 | 名前でプロジェクトを作成LuceneFirstApplicationパッケージの下com.tutorialspoint.luceneで説明したように最初のアプリケーション- Luceneの章を。Lucene-First Applicationの章で作成されたプロジェクトをこの章で使用して、検索プロセスを理解することもできます。 |
2 | Lucene-最初のアプリケーションの章で説明されているように、LuceneConstants.java、TextFileFilter.java、およびSearcher.javaを作成します。残りのファイルは変更しないでください。 |
3 | 以下に説明するように、LuceneTester.javaを作成します。 |
4 | アプリケーションをクリーンアップしてビルドし、ビジネスロジックが要件に従って機能していることを確認します。 |
LuceneConstants.java
このクラスは、サンプルアプリケーション全体で使用されるさまざまな定数を提供するために使用されます。
package com.tutorialspoint.lucene;
public class LuceneConstants {
public static final String CONTENTS = "contents";
public static final String FILE_NAME = "filename";
public static final String FILE_PATH = "filepath";
public static final int MAX_SEARCH = 10;
}
TextFileFilter.java
このクラスは、 .txt ファイルフィルター。
package com.tutorialspoint.lucene;
import java.io.File;
import java.io.FileFilter;
public class TextFileFilter implements FileFilter {
@Override
public boolean accept(File pathname) {
return pathname.getName().toLowerCase().endsWith(".txt");
}
}
Searcher.java
このクラスは、生データに対して作成されたインデックスを読み取り、Luceneライブラリを使用してデータを検索するために使用されます。
package com.tutorialspoint.lucene;
import java.io.File;
import java.io.IOException;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
public class Searcher {
IndexSearcher indexSearcher;
QueryParser queryParser;
Query query;
public Searcher(String indexDirectoryPath) throws IOException {
Directory indexDirectory =
FSDirectory.open(new File(indexDirectoryPath));
indexSearcher = new IndexSearcher(indexDirectory);
queryParser = new QueryParser(Version.LUCENE_36,
LuceneConstants.CONTENTS,
new StandardAnalyzer(Version.LUCENE_36));
}
public TopDocs search( String searchQuery)
throws IOException, ParseException {
query = queryParser.parse(searchQuery);
return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
}
public Document getDocument(ScoreDoc scoreDoc)
throws CorruptIndexException, IOException {
return indexSearcher.doc(scoreDoc.doc);
}
public void close() throws IOException {
indexSearcher.close();
}
}
LuceneTester.java
このクラスは、Luceneライブラリの検索機能をテストするために使用されます。
package com.tutorialspoint.lucene;
import java.io.IOException;
import org.apache.lucene.document.Document;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
public class LuceneTester {
String indexDir = "E:\\Lucene\\Index";
String dataDir = "E:\\Lucene\\Data";
Searcher searcher;
public static void main(String[] args) {
LuceneTester tester;
try {
tester = new LuceneTester();
tester.search("Mohan");
} catch (IOException e) {
e.printStackTrace();
} catch (ParseException e) {
e.printStackTrace();
}
}
private void search(String searchQuery) throws IOException, ParseException {
searcher = new Searcher(indexDir);
long startTime = System.currentTimeMillis();
TopDocs hits = searcher.search(searchQuery);
long endTime = System.currentTimeMillis();
System.out.println(hits.totalHits +
" documents found. Time :" + (endTime - startTime) +" ms");
for(ScoreDoc scoreDoc : hits.scoreDocs) {
Document doc = searcher.getDocument(scoreDoc);
System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
}
searcher.close();
}
}
データとインデックスディレクトリの作成
record1.txtという名前の10個のテキストファイルを使用して、学生の名前やその他の詳細を含むrecord10.txtを作成し、ディレクトリE:\ Lucene \ Dataに配置しました。テストデータ。インデックスディレクトリパスは、E:\ Lucene \ Indexとして作成する必要があります。この章のインデックス作成プログラムを実行した後Lucene - Indexing Process、そのフォルダに作成されたインデックスファイルのリストを見ることができます。
プログラムの実行
ソース、生データ、データディレクトリ、インデックスディレクトリ、およびインデックスの作成が完了したら、プログラムをコンパイルして実行することで続行できます。これを行うには、LuceneTester.Java [ファイル]タブがアクティブで、Eclipse IDEで使用可能な[実行]オプションを使用するか、 Ctrl + F11 コンパイルして実行するには LuceneTesterapplication。アプリケーションが正常に実行されると、EclipseIDEのコンソールに次のメッセージが出力されます-
1 documents found. Time :29 ms
File: E:\Lucene\Data\record4.txt