Lucene - Краткое руководство

Lucene - это простой, но мощный инструмент на основе Java. Searchбиблиотека. Его можно использовать в любом приложении, чтобы добавить в него возможность поиска. Lucene - это проект с открытым исходным кодом. Это масштабируемое. Эта высокопроизводительная библиотека используется для индексации и поиска практически любого текста. Библиотека Lucene обеспечивает основные операции, которые требуются любому поисковому приложению. Индексирование и поиск.

Как работает приложение для поиска?

Приложение поиска выполняет все или некоторые из следующих операций:

Шаг заглавие Описание
1

Acquire Raw Content

Первым шагом любого поискового приложения является сбор целевого содержания, на котором должно выполняться поисковое приложение.

2

Build the document

Следующим шагом является создание документа (ов) из необработанного контента, который поисковое приложение может легко понять и интерпретировать.

3

Analyze the document

Перед началом процесса индексирования документ должен быть проанализирован на предмет того, какая часть текста может быть проиндексирована. В этом процессе документ анализируется.

4

Indexing the document

После того, как документы построены и проанализированы, следующим шагом будет их индексация, чтобы этот документ можно было извлечь на основе определенных ключей, а не всего содержимого документа. Процесс индексирования аналогичен индексам в конце книги, где общие слова отображаются с номерами страниц, так что эти слова можно быстро отслеживать, а не искать по всей книге.

5

User Interface for Search

Когда база данных индексов готова, приложение может выполнять любой поиск. Чтобы облегчить пользователю поиск, приложение должно предоставить пользователюa mean или же a user interface где пользователь может ввести текст и начать процесс поиска.

6

Build Query

Как только пользователь делает запрос на поиск текста, приложение должно подготовить объект Query, используя этот текст, который можно использовать для запроса базы данных индекса для получения соответствующих деталей.

7

Search Query

Затем с помощью объекта запроса проверяется база данных индекса, чтобы получить соответствующие сведения и документы содержимого.

8

Render Results

После получения результата приложение должно решить, как показать результаты пользователю с помощью пользовательского интерфейса. Сколько информации должно быть показано на первый взгляд и так далее.

Помимо этих основных операций, поисковое приложение также может предоставлять administration user interfaceи помочь администраторам приложения контролировать уровень поиска на основе профилей пользователей. Аналитика результатов поиска - еще один важный и продвинутый аспект любого поискового приложения.

Роль Lucene в поисковом приложении

Lucene играет роль на этапах 2–7, упомянутых выше, и предоставляет классы для выполнения необходимых операций. Короче говоря, Lucene является сердцем любого поискового приложения и обеспечивает жизненно важные операции, относящиеся к индексированию и поиску. Получение содержимого и отображение результатов остается на усмотрение части приложения.

В следующей главе мы выполним простое приложение поиска с использованием библиотеки поиска Lucene.

В этом руководстве вы узнаете, как подготовить среду разработки для начала работы со Spring Framework. Это руководство также научит вас, как настроить JDK, Tomcat и Eclipse на вашем компьютере, прежде чем вы установите Spring Framework -

Шаг 1 - Установка Java Development Kit (JDK)

Вы можете загрузить последнюю версию SDK с сайта Oracle Java: Java SE Downloads . Вы найдете инструкции по установке JDK в загруженных файлах; следуйте приведенным инструкциям, чтобы установить и настроить установку. Наконец, установите переменные среды PATH и JAVA_HOME так, чтобы они ссылались на каталог, содержащий Java и javac, обычно java_install_dir / bin и java_install_dir соответственно.

Если вы работаете в Windows и установили JDK в C: \ jdk1.6.0_15, вам нужно будет поместить следующую строку в файл C: \ autoexec.bat.

set PATH = C:\jdk1.6.0_15\bin;%PATH%
set JAVA_HOME = C:\jdk1.6.0_15

Кроме того, в Windows NT / 2000 / XP вы также можете щелкнуть правой кнопкой мыши My Computer, Выбрать Properties, тогда Advanced, тогда Environment Variables. Затем вы обновитеPATH значение и нажмите OK кнопка.

В Unix (Solaris, Linux и т. Д.), Если SDK установлен в /usr/local/jdk1.6.0_15 и вы используете оболочку C, вы должны поместить следующее в свой файл .cshrc.

setenv PATH /usr/local/jdk1.6.0_15/bin:$PATH
setenv JAVA_HOME /usr/local/jdk1.6.0_15

В качестве альтернативы, если вы используете Integrated Development Environment (IDE) например Borland JBuilder, Eclipse, IntelliJ IDEA или Sun ONE Studio, скомпилируйте и запустите простую программу, чтобы убедиться, что IDE знает, где вы установили Java, в противном случае выполните правильную настройку, как указано в документе IDE.

Шаг 2 - Настройка Eclipse IDE

Все примеры в этом руководстве были написаны с использованием Eclipse IDE. Поэтому я бы посоветовал вам установить на свой компьютер последнюю версию Eclipse.

Чтобы установить Eclipse IDE, загрузите последние двоичные файлы Eclipse из https://www.eclipse.org/downloads/. После того, как вы скачали установку, распакуйте двоичный дистрибутив в удобное место. Например, вC:\eclipse on windows, или же /usr/local/eclipse on Linux/Unix и, наконец, установите переменную PATH соответствующим образом.

Eclipse можно запустить, выполнив следующие команды на компьютере с Windows, или вы можете просто дважды щелкнуть по eclipse.exe

%C:\eclipse\eclipse.exe

Eclipse можно запустить, выполнив следующие команды на машине Unix (Solaris, Linux и т. Д.):

$/usr/local/eclipse/eclipse

После успешного запуска он должен отобразить следующий результат -

Шаг 3 - Установите библиотеки Lucene Framework

Если запуск прошел успешно, вы можете приступить к настройке фреймворка Lucene. Ниже приведены простые шаги по загрузке и установке фреймворка на ваш компьютер.

https://archive.apache.org/dist/lucene/java/3.6.2/

  • Сделайте выбор, хотите ли вы установить Lucene в Windows или Unix, а затем перейдите к следующему шагу, чтобы загрузить файл .zip для Windows и файл .tz для Unix.

  • Загрузите подходящую версию двоичных файлов фреймворка Lucene из https://archive.apache.org/dist/lucene/java/.

  • На момент написания этого руководства я загрузил lucene-3.6.2.zip на свой компьютер с Windows, и когда вы разархивируете загруженный файл, он предоставит вам структуру каталогов внутри C: \ lucene-3.6.2, как показано ниже.

Вы найдете все библиотеки Lucene в каталоге C:\lucene-3.6.2. Убедитесь, что вы правильно установили переменную CLASSPATH в этом каталоге, иначе вы столкнетесь с проблемой при запуске вашего приложения. Если вы используете Eclipse, то устанавливать CLASSPATH не обязательно, потому что все настройки будут выполняться через Eclipse.

Как только вы закончите этот последний шаг, вы готовы приступить к первому примеру Lucene, который вы увидите в следующей главе.

В этой главе мы изучим фактическое программирование с помощью Lucene Framework. Прежде чем вы начнете писать свой первый пример с использованием фреймворка Lucene, вы должны убедиться, что вы правильно настроили среду Lucene, как описано в руководстве по настройке среды Lucene . Рекомендуется иметь практические знания Eclipse IDE.

Давайте теперь приступим к написанию простого приложения поиска, которое будет печатать количество найденных результатов поиска. Мы также увидим список индексов, созданных во время этого процесса.

Шаг 1 - Создайте проект Java

Первый шаг - создать простой Java-проект с использованием Eclipse IDE. Следуйте вариантуFile > New -> Project и, наконец, выберите Java Projectмастер из списка мастеров. Теперь назовите свой проект какLuceneFirstApplication используя окно мастера следующим образом -

После успешного создания проекта у вас будет следующий контент в вашем Project Explorer -

Шаг 2 - Добавьте необходимые библиотеки

Давайте теперь добавим библиотеку ядра Lucene Framework в наш проект. Для этого щелкните правой кнопкой мыши название вашего проекта.LuceneFirstApplication а затем выполните следующую опцию, доступную в контекстном меню: Build Path -> Configure Build Path чтобы отобразить окно пути сборки Java следующим образом -

Теперь используйте Add External JARs кнопка доступна под Libraries вкладка, чтобы добавить следующий основной JAR из каталога установки Lucene -

  • lucene-core-3.6.2

Шаг 3 - Создание исходных файлов

Давайте теперь создадим реальные исходные файлы под LuceneFirstApplicationпроект. Сначала нам нужно создать пакет под названиемcom.tutorialspoint.lucene. Для этого щелкните правой кнопкой мыши на src в разделе проводника пакетов и выполните следующие действия: New -> Package.

Далее мы создадим LuceneTester.java и другие классы Java под com.tutorialspoint.lucene пакет.

LuceneConstants.java

Этот класс используется для предоставления различных констант для использования в примере приложения.

package com.tutorialspoint.lucene;

public class LuceneConstants {
   public static final String CONTENTS = "contents";
   public static final String FILE_NAME = "filename";
   public static final String FILE_PATH = "filepath";
   public static final int MAX_SEARCH = 10;
}

TextFileFilter.java

Этот класс используется как .txt file фильтр.

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.FileFilter;

public class TextFileFilter implements FileFilter {

   @Override
   public boolean accept(File pathname) {
      return pathname.getName().toLowerCase().endsWith(".txt");
   }
}

Indexer.java

Этот класс используется для индексации необработанных данных, чтобы мы могли сделать их доступными для поиска с помощью библиотеки Lucene.

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.FileFilter;
import java.io.FileReader;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class Indexer {

   private IndexWriter writer;

   public Indexer(String indexDirectoryPath) throws IOException {
      //this directory will contain the indexes
      Directory indexDirectory = 
         FSDirectory.open(new File(indexDirectoryPath));

      //create the indexer
      writer = new IndexWriter(indexDirectory, 
         new StandardAnalyzer(Version.LUCENE_36),true, 
         IndexWriter.MaxFieldLength.UNLIMITED);
   }

   public void close() throws CorruptIndexException, IOException {
      writer.close();
   }

   private Document getDocument(File file) throws IOException {
      Document document = new Document();

      //index file contents
      Field contentField = new Field(LuceneConstants.CONTENTS, new FileReader(file));
      //index file name
      Field fileNameField = new Field(LuceneConstants.FILE_NAME,
         file.getName(),Field.Store.YES,Field.Index.NOT_ANALYZED);
      //index file path
      Field filePathField = new Field(LuceneConstants.FILE_PATH,
         file.getCanonicalPath(),Field.Store.YES,Field.Index.NOT_ANALYZED);

      document.add(contentField);
      document.add(fileNameField);
      document.add(filePathField);

      return document;
   }   

   private void indexFile(File file) throws IOException {
      System.out.println("Indexing "+file.getCanonicalPath());
      Document document = getDocument(file);
      writer.addDocument(document);
   }

   public int createIndex(String dataDirPath, FileFilter filter) 
      throws IOException {
      //get all files in the data directory
      File[] files = new File(dataDirPath).listFiles();

      for (File file : files) {
         if(!file.isDirectory()
            && !file.isHidden()
            && file.exists()
            && file.canRead()
            && filter.accept(file)
         ){
            indexFile(file);
         }
      }
      return writer.numDocs();
   }
}

Searcher.java

Этот класс используется для поиска в индексах, созданных индексатором для поиска запрошенного содержимого.

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class Searcher {
	
   IndexSearcher indexSearcher;
   QueryParser queryParser;
   Query query;
   
   public Searcher(String indexDirectoryPath) 
      throws IOException {
      Directory indexDirectory = 
         FSDirectory.open(new File(indexDirectoryPath));
      indexSearcher = new IndexSearcher(indexDirectory);
      queryParser = new QueryParser(Version.LUCENE_36,
         LuceneConstants.CONTENTS,
         new StandardAnalyzer(Version.LUCENE_36));
   }
   
   public TopDocs search( String searchQuery) 
      throws IOException, ParseException {
      query = queryParser.parse(searchQuery);
      return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
   }

   public Document getDocument(ScoreDoc scoreDoc) 
      throws CorruptIndexException, IOException {
      return indexSearcher.doc(scoreDoc.doc);	
   }

   public void close() throws IOException {
      indexSearcher.close();
   }
}

LuceneTester.java

Этот класс используется для проверки возможности индексирования и поиска библиотеки lucene.

package com.tutorialspoint.lucene;

import java.io.IOException;

import org.apache.lucene.document.Document;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;

public class LuceneTester {
	
   String indexDir = "E:\\Lucene\\Index";
   String dataDir = "E:\\Lucene\\Data";
   Indexer indexer;
   Searcher searcher;

   public static void main(String[] args) {
      LuceneTester tester;
      try {
         tester = new LuceneTester();
         tester.createIndex();
         tester.search("Mohan");
      } catch (IOException e) {
         e.printStackTrace();
      } catch (ParseException e) {
         e.printStackTrace();
      }
   }

   private void createIndex() throws IOException {
      indexer = new Indexer(indexDir);
      int numIndexed;
      long startTime = System.currentTimeMillis();	
      numIndexed = indexer.createIndex(dataDir, new TextFileFilter());
      long endTime = System.currentTimeMillis();
      indexer.close();
      System.out.println(numIndexed+" File indexed, time taken: "
         +(endTime-startTime)+" ms");		
   }

   private void search(String searchQuery) throws IOException, ParseException {
      searcher = new Searcher(indexDir);
      long startTime = System.currentTimeMillis();
      TopDocs hits = searcher.search(searchQuery);
      long endTime = System.currentTimeMillis();
   
      System.out.println(hits.totalHits +
         " documents found. Time :" + (endTime - startTime));
      for(ScoreDoc scoreDoc : hits.scoreDocs) {
         Document doc = searcher.getDocument(scoreDoc);
            System.out.println("File: "
            + doc.get(LuceneConstants.FILE_PATH));
      }
      searcher.close();
   }
}

Шаг 4 - Создание каталога данных и индекса

Мы использовали 10 текстовых файлов от record1.txt до record10.txt, содержащих имена и другие данные об учениках, и поместили их в каталог. E:\Lucene\Data. Данные испытаний . Путь к каталогу индекса должен быть создан какE:\Lucene\Index. После запуска этой программы вы можете увидеть список индексных файлов, созданных в этой папке.

Шаг 5 - Запуск программы

Как только вы закончите создание источника, необработанных данных, каталога данных и каталога индекса, вы готовы к компиляции и запуску вашей программы. Для этого держитеLuceneTester.Java вкладка файла активна и используйте либо Run вариант, доступный в Eclipse IDE, или используйте Ctrl + F11 скомпилировать и запустить ваш LuceneTesterприменение. Если приложение запустится успешно, оно напечатает следующее сообщение в консоли Eclipse IDE:

Indexing E:\Lucene\Data\record1.txt
Indexing E:\Lucene\Data\record10.txt
Indexing E:\Lucene\Data\record2.txt
Indexing E:\Lucene\Data\record3.txt
Indexing E:\Lucene\Data\record4.txt
Indexing E:\Lucene\Data\record5.txt
Indexing E:\Lucene\Data\record6.txt
Indexing E:\Lucene\Data\record7.txt
Indexing E:\Lucene\Data\record8.txt
Indexing E:\Lucene\Data\record9.txt
10 File indexed, time taken: 109 ms
1 documents found. Time :0
File: E:\Lucene\Data\record4.txt

После того, как вы успешно запустите программу, в вашем index directory -

Процесс индексирования - одна из основных функций, предоставляемых Lucene. Следующая диаграмма иллюстрирует процесс индексирования и использование классов.IndexWriter это самый важный и ключевой компонент процесса индексации.

Мы добавляем Document(s) содержащий Field(s) в IndexWriter, который анализирует Document(s) используя Analyzer а затем создает / открывает / редактирует индексы по мере необходимости и сохраняет / обновляет их в Directory. IndexWriter используется для обновления или создания индексов. Он не используется для чтения индексов.

Индексирование классов

Ниже приведен список часто используемых классов в процессе индексации.

S.No. Класс и описание
1 IndexWriter

Этот класс действует как основной компонент, который создает / обновляет индексы в процессе индексации.

2 Каталог

Этот класс представляет место хранения индексов.

3 Анализатор

Этот класс отвечает за анализ документа и получение токенов / слов из текста, который нужно проиндексировать. Без проведения анализа IndexWriter не может создать индекс.

4 Документ

Этот класс представляет виртуальный документ с полями, где поле представляет собой объект, который может содержать содержимое физического документа, его метаданные и так далее. Анализатор может понимать только Документ.

5 Поле

Это самая низкая единица или начальная точка процесса индексации. Он представляет собой взаимосвязь пары «ключ-значение», где ключ используется для идентификации значения, которое нужно проиндексировать. Предположим, что поле, используемое для представления содержимого документа, будет иметь ключ как «содержимое», а значение может содержать часть или все текстовое или числовое содержимое документа. Lucene может индексировать только текстовый или числовой контент.

Процесс поиска снова является одной из основных функций, предоставляемых Lucene. Его поток аналогичен процессу индексации. Базовый поиск в Lucene может быть выполнен с использованием следующих классов, которые также можно назвать базовыми классами для всех операций, связанных с поиском.

Поиск классов

Ниже приведен список часто используемых классов в процессе поиска.

S.No. Класс и описание
1 IndexSearcher

Этот класс действует как основной компонент, который читает / ищет индексы, созданные после процесса индексации. Требуется экземпляр каталога, указывающий на расположение, содержащее индексы.

2 Срок

Этот класс - самая низкая единица поиска. Он похож на Поле в процессе индексирования.

3 Запрос

Query - это абстрактный класс, содержащий различные служебные методы и родительский для всех типов запросов, которые Lucene использует в процессе поиска.

4 TermQuery

TermQuery - это наиболее часто используемый объект запроса и основа многих сложных запросов, которые может использовать Lucene.

5 TopDocs

TopDocs указывает на первые N результатов поиска, которые соответствуют критериям поиска. Это простой контейнер указателей, указывающий на документы, которые являются результатом поиска.

Процесс индексирования - одна из основных функций, предоставляемых Lucene. Следующая диаграмма иллюстрирует процесс индексирования и использование классов. IndexWriter - самый важный и основной компонент процесса индексирования.

Мы добавляем документ (ы), содержащий поля, в IndexWriter, который анализирует документ (ы) с помощью анализатора, а затем создает / открывает / редактирует индексы по мере необходимости и сохраняет / обновляет их в каталоге . IndexWriter используется для обновления или создания индексов. Он не используется для чтения индексов.

Теперь мы покажем вам пошаговый процесс, чтобы начать понимание процесса индексирования на базовом примере.

Создать документ

  • Создайте метод для получения документа Lucene из текстового файла.

  • Создавайте различные типы полей, которые представляют собой пары ключ-значение, содержащие ключи в качестве имен и значения в качестве содержимого для индексации.

  • Установить поле для анализа или нет. В нашем случае нужно анализировать только содержимое, поскольку оно может содержать такие данные, как a, am, are, an и т. Д., Которые не требуются для операций поиска.

  • Добавьте вновь созданные поля к объекту документа и верните его вызывающему методу.

private Document getDocument(File file) throws IOException {
   Document document = new Document();
   
   //index file contents
   Field contentField = new Field(LuceneConstants.CONTENTS, 
      new FileReader(file));
   
   //index file name
   Field fileNameField = new Field(LuceneConstants.FILE_NAME,
      file.getName(),
      Field.Store.YES,Field.Index.NOT_ANALYZED);
   
   //index file path
   Field filePathField = new Field(LuceneConstants.FILE_PATH,
      file.getCanonicalPath(),
      Field.Store.YES,Field.Index.NOT_ANALYZED);

   document.add(contentField);
   document.add(fileNameField);
   document.add(filePathField);

   return document;
}

Создать IndexWriter

Класс IndexWriter действует как основной компонент, который создает / обновляет индексы в процессе индексирования. Выполните следующие действия, чтобы создать IndexWriter -

Step 1 - Создать объект IndexWriter.

Step 2 - Создайте каталог Lucene, который должен указывать на место, где должны храниться индексы.

Step 3 - Инициализировать объект IndexWriter, созданный с каталогом индекса, стандартным анализатором, имеющим информацию о версии и другие обязательные / необязательные параметры.

private IndexWriter writer;

public Indexer(String indexDirectoryPath) throws IOException {
   //this directory will contain the indexes
   Directory indexDirectory = 
      FSDirectory.open(new File(indexDirectoryPath));
   
   //create the indexer
   writer = new IndexWriter(indexDirectory, 
      new StandardAnalyzer(Version.LUCENE_36),true,
      IndexWriter.MaxFieldLength.UNLIMITED);
}

Начать процесс индексирования

Следующая программа показывает, как начать процесс индексации -

private void indexFile(File file) throws IOException {
   System.out.println("Indexing "+file.getCanonicalPath());
   Document document = getDocument(file);
   writer.addDocument(document);
}

Пример приложения

Чтобы протестировать процесс индексации, нам нужно создать тест приложения Lucene.

Шаг Описание
1

Создайте проект с именем LuceneFirstApplication в пакете com.tutorialspoint.lucene, как описано в главе Lucene - Первое приложение . Вы также можете использовать проект, созданный в главе Lucene - Первое приложение, как таковой для этой главы, чтобы понять процесс индексации.

2

Создайте LuceneConstants.java, TextFileFilter.java и Indexer.java, как описано в главе Lucene - Первое приложение . Остальные файлы оставьте без изменений.

3

Создайте LuceneTester.java, как указано ниже.

4

Очистите и создайте приложение, чтобы убедиться, что бизнес-логика работает в соответствии с требованиями.

LuceneConstants.java

Этот класс используется для предоставления различных констант для использования в примере приложения.

package com.tutorialspoint.lucene;

public class LuceneConstants {
   public static final String CONTENTS = "contents";
   public static final String FILE_NAME = "filename";
   public static final String FILE_PATH = "filepath";
   public static final int MAX_SEARCH = 10;
}

TextFileFilter.java

Этот класс используется как .txt файловый фильтр.

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.FileFilter;

public class TextFileFilter implements FileFilter {

   @Override
   public boolean accept(File pathname) {
      return pathname.getName().toLowerCase().endsWith(".txt");
   }
}

Indexer.java

Этот класс используется для индексации необработанных данных, чтобы мы могли сделать их доступными для поиска с помощью библиотеки Lucene.

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.FileFilter;
import java.io.FileReader;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class Indexer {

   private IndexWriter writer;

   public Indexer(String indexDirectoryPath) throws IOException {
      //this directory will contain the indexes
      Directory indexDirectory = 
         FSDirectory.open(new File(indexDirectoryPath));

      //create the indexer
      writer = new IndexWriter(indexDirectory, 
         new StandardAnalyzer(Version.LUCENE_36),true,
         IndexWriter.MaxFieldLength.UNLIMITED);
   }

   public void close() throws CorruptIndexException, IOException {
      writer.close();
   }

   private Document getDocument(File file) throws IOException {
      Document document = new Document();

      //index file contents
      Field contentField = new Field(LuceneConstants.CONTENTS, 
         new FileReader(file));
      
      //index file name
      Field fileNameField = new Field(LuceneConstants.FILE_NAME,
         file.getName(),
         Field.Store.YES,Field.Index.NOT_ANALYZED);
      
      //index file path
      Field filePathField = new Field(LuceneConstants.FILE_PATH,
         file.getCanonicalPath(),
         Field.Store.YES,Field.Index.NOT_ANALYZED);

      document.add(contentField);
      document.add(fileNameField);
      document.add(filePathField);

      return document;
   }   

   private void indexFile(File file) throws IOException {
      System.out.println("Indexing "+file.getCanonicalPath());
      Document document = getDocument(file);
      writer.addDocument(document);
   }

   public int createIndex(String dataDirPath, FileFilter filter) 
      throws IOException {
      //get all files in the data directory
      File[] files = new File(dataDirPath).listFiles();

      for (File file : files) {
         if(!file.isDirectory()
            && !file.isHidden()
            && file.exists()
            && file.canRead()
            && filter.accept(file)
         ){
            indexFile(file);
         }
      }
      return writer.numDocs();
   }
}

LuceneTester.java

Этот класс используется для проверки возможности индексирования библиотеки Lucene.

package com.tutorialspoint.lucene;

import java.io.IOException;

public class LuceneTester {
	
   String indexDir = "E:\\Lucene\\Index";
   String dataDir = "E:\\Lucene\\Data";
   Indexer indexer;
   
   public static void main(String[] args) {
      LuceneTester tester;
      try {
         tester = new LuceneTester();
         tester.createIndex();
      } catch (IOException e) {
         e.printStackTrace();
      } 
   }

   private void createIndex() throws IOException {
      indexer = new Indexer(indexDir);
      int numIndexed;
      long startTime = System.currentTimeMillis();	
      numIndexed = indexer.createIndex(dataDir, new TextFileFilter());
      long endTime = System.currentTimeMillis();
      indexer.close();
      System.out.println(numIndexed+" File indexed, time taken: "
         +(endTime-startTime)+" ms");		
   }
}

Создание каталога данных и индекса

Мы использовали 10 текстовых файлов от record1.txt до record10.txt, содержащих имена и другие данные об учениках, и поместили их в каталог. E:\Lucene\Data. Данные испытаний . Путь к каталогу индекса должен быть создан какE:\Lucene\Index. После запуска этой программы вы можете увидеть список индексных файлов, созданных в этой папке.

Запуск программы

После того, как вы закончите создание источника, необработанных данных, каталога данных и каталога индекса, вы можете приступить к компиляции и запуску вашей программы. Для этого оставьте вкладку файла LuceneTester.Java активной и используйте либоRun вариант, доступный в Eclipse IDE, или используйте Ctrl + F11 скомпилировать и запустить ваш LuceneTesterприменение. Если ваше приложение работает успешно, оно напечатает следующее сообщение в консоли Eclipse IDE:

Indexing E:\Lucene\Data\record1.txt
Indexing E:\Lucene\Data\record10.txt
Indexing E:\Lucene\Data\record2.txt
Indexing E:\Lucene\Data\record3.txt
Indexing E:\Lucene\Data\record4.txt
Indexing E:\Lucene\Data\record5.txt
Indexing E:\Lucene\Data\record6.txt
Indexing E:\Lucene\Data\record7.txt
Indexing E:\Lucene\Data\record8.txt
Indexing E:\Lucene\Data\record9.txt
10 File indexed, time taken: 109 ms

После того, как вы успешно запустите программу, в вашем index directory −

В этой главе мы обсудим четыре основных операции индексации. Эти операции полезны в разное время и используются во всем приложении для поиска программного обеспечения.

Индексирование операций

Ниже приводится список часто используемых операций в процессе индексирования.

S.No. Работа и описание
1 Добавить документ

Эта операция используется на начальном этапе процесса индексирования для создания индексов для вновь доступного контента.

2 Обновить документ

Эта операция используется для обновления индексов, чтобы отразить изменения в обновленном содержимом. Это похоже на воссоздание индекса.

3 Удалить документ

Эта операция используется для обновления индексов, чтобы исключить документы, которые не требуется индексировать / искать.

4 Параметры поля

Параметры поля определяют способ или управляют способами, с помощью которых содержимое поля должно быть доступно для поиска.

Процесс поиска - одна из основных функций, предоставляемых Lucene. Следующая диаграмма иллюстрирует процесс и его использование. IndexSearcher - один из основных компонентов поискового процесса.

Сначала мы создаем каталог (и), содержащий индексы, а затем передаем его IndexSearcher, который открывает каталог с помощью IndexReader . Затем мы создаем запрос с Term и сделать поиск с помощью IndexSearcher , передавая запрос в поисковике. IndexSearcher возвращает объект TopDocs, который содержит сведения о поиске вместе с идентификаторами документов документа, который является результатом операции поиска.

Теперь мы покажем вам пошаговый подход и поможем понять процесс индексирования на базовом примере.

Создать QueryParser

Класс QueryParser анализирует введенные пользователем данные в запрос понятного формата Lucene. Выполните следующие действия, чтобы создать QueryParser -

Step 1 - Создать объект QueryParser.

Step 2 - Инициализировать объект QueryParser, созданный с помощью стандартного анализатора, имеющего информацию о версии и имя индекса, на котором будет выполняться этот запрос.

QueryParser queryParser;

public Searcher(String indexDirectoryPath) throws IOException {

   queryParser = new QueryParser(Version.LUCENE_36,
      LuceneConstants.CONTENTS,
      new StandardAnalyzer(Version.LUCENE_36));
}

Создать IndexSearcher

Класс IndexSearcher действует как основной компонент, который индексирует поисковые запросы, созданные в процессе индексирования. Выполните следующие шаги, чтобы создать IndexSearcher -

Step 1 - Создать объект IndexSearcher.

Step 2 - Создайте каталог Lucene, который должен указывать на место, где должны храниться индексы.

Step 3 - Инициализировать объект IndexSearcher, созданный с помощью каталога индекса.

IndexSearcher indexSearcher;

public Searcher(String indexDirectoryPath) throws IOException {
   Directory indexDirectory = 
      FSDirectory.open(new File(indexDirectoryPath));
   indexSearcher = new IndexSearcher(indexDirectory);
}

Сделать поиск

Выполните следующие действия, чтобы выполнить поиск -

Step 1 - Создайте объект Query, проанализировав поисковое выражение с помощью QueryParser.

Step 2 - Выполните поиск, вызвав метод IndexSearcher.search ().

Query query;

public TopDocs search( String searchQuery) throws IOException, ParseException {
   query = queryParser.parse(searchQuery);
   return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
}

Получить документ

Следующая программа показывает, как получить документ.

public Document getDocument(ScoreDoc scoreDoc) 
   throws CorruptIndexException, IOException {
   return indexSearcher.doc(scoreDoc.doc);	
}

Закрыть IndexSearcher

Следующая программа показывает, как закрыть IndexSearcher.

public void close() throws IOException {
   indexSearcher.close();
}

Пример приложения

Давайте создадим тестовое приложение Lucene для тестирования процесса поиска.

Шаг Описание
1

Создайте проект с именем LuceneFirstApplication в пакете com.tutorialspoint.lucene, как описано в главе Lucene - Первое приложение . Вы также можете использовать проект, созданный в главе Lucene - Первое приложение, как таковой для этой главы, чтобы понять процесс поиска.

2

Создайте LuceneConstants.java, TextFileFilter.java и Searcher.java, как описано в главе Lucene - Первое приложение . Остальные файлы оставьте без изменений.

3

Создайте LuceneTester.java, как указано ниже.

4

Очистите и создайте приложение, чтобы убедиться, что бизнес-логика работает в соответствии с требованиями.

LuceneConstants.java

Этот класс используется для предоставления различных констант для использования в примере приложения.

package com.tutorialspoint.lucene;

public class LuceneConstants {
   public static final String CONTENTS = "contents";
   public static final String FILE_NAME = "filename";
   public static final String FILE_PATH = "filepath";
   public static final int MAX_SEARCH = 10;
}

TextFileFilter.java

Этот класс используется как .txt файловый фильтр.

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.FileFilter;

public class TextFileFilter implements FileFilter {

   @Override
   public boolean accept(File pathname) {
      return pathname.getName().toLowerCase().endsWith(".txt");
   }
}

Searcher.java

Этот класс используется для чтения индексов, сделанных на необработанных данных, и поиска данных с помощью библиотеки Lucene.

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class Searcher {
	
   IndexSearcher indexSearcher;
   QueryParser queryParser;
   Query query;

   public Searcher(String indexDirectoryPath) throws IOException {
      Directory indexDirectory = 
         FSDirectory.open(new File(indexDirectoryPath));
      indexSearcher = new IndexSearcher(indexDirectory);
      queryParser = new QueryParser(Version.LUCENE_36,
         LuceneConstants.CONTENTS,
         new StandardAnalyzer(Version.LUCENE_36));
   }

   public TopDocs search( String searchQuery) 
      throws IOException, ParseException {
      query = queryParser.parse(searchQuery);
      return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
   }

   public Document getDocument(ScoreDoc scoreDoc) 
      throws CorruptIndexException, IOException {
      return indexSearcher.doc(scoreDoc.doc);	
   }

   public void close() throws IOException {
      indexSearcher.close();
   }
}

LuceneTester.java

Этот класс используется для проверки возможности поиска библиотеки Lucene.

package com.tutorialspoint.lucene;

import java.io.IOException;

import org.apache.lucene.document.Document;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;

public class LuceneTester {
	
   String indexDir = "E:\\Lucene\\Index";
   String dataDir = "E:\\Lucene\\Data";
   Searcher searcher;

   public static void main(String[] args) {
      LuceneTester tester;
      try {
         tester = new LuceneTester();
         tester.search("Mohan");
      } catch (IOException e) {
         e.printStackTrace();
      } catch (ParseException e) {
         e.printStackTrace();
      }
   }

   private void search(String searchQuery) throws IOException, ParseException {
      searcher = new Searcher(indexDir);
      long startTime = System.currentTimeMillis();
      TopDocs hits = searcher.search(searchQuery);
      long endTime = System.currentTimeMillis();

      System.out.println(hits.totalHits +
         " documents found. Time :" + (endTime - startTime) +" ms");
      for(ScoreDoc scoreDoc : hits.scoreDocs) {
         Document doc = searcher.getDocument(scoreDoc);
         System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
      }
      searcher.close();
   }	
}

Создание каталога данных и индекса

Мы использовали 10 текстовых файлов с именами от record1.txt до record10.txt, содержащих имена и другую информацию об учениках, и поместили их в каталог E: \ Lucene \ Data. Данные испытаний . Путь к каталогу индекса должен быть создан как E: \ Lucene \ Index. После запуска программы индексации в главеLucene - Indexing Process, вы можете увидеть список индексных файлов, созданных в этой папке.

Запуск программы

После того как вы закончите создание источника, необработанных данных, каталога данных, каталога индексов и индексов, вы можете приступить к компиляции и запуску вашей программы. Для этого держитеLuceneTester.Java активна вкладка файла и используйте либо опцию Run, доступную в Eclipse IDE, либо используйте Ctrl + F11 скомпилировать и запустить ваш LuceneTesterapplication. Если ваше приложение работает успешно, оно напечатает следующее сообщение в консоли Eclipse IDE:

1 documents found. Time :29 ms
File: E:\Lucene\Data\record4.txt

Мы видели в предыдущей главе Lucene - Search Operation, Lucene использует IndexSearcher для поиска и использует объект Query, созданный QueryParser, в качестве входных данных. В этой главе мы собираемся обсудить различные типы объектов Query и различные способы их программного создания. Создание различных типов объектов Query позволяет управлять типом выполняемого поиска.

Рассмотрим вариант расширенного поиска, предоставляемый многими приложениями, в котором пользователям предоставляется несколько вариантов ограничения результатов поиска. С помощью программирования запросов мы можем очень легко добиться того же.

Ниже приводится список типов запросов, которые мы обсудим в свое время.

S.No. Класс и описание
1 TermQuery

Этот класс действует как основной компонент, который создает / обновляет индексы в процессе индексации.

2 TermRangeQuery

TermRangeQuery используется, когда необходимо выполнить поиск по диапазону текстовых терминов.

3 PrefixQuery

PrefixQuery используется для поиска документов, индекс которых начинается с указанной строки.

4 BooleanQuery

BooleanQuery используется для поиска документов, которые являются результатом нескольких запросов с использованием AND, OR или же NOT операторы.

5 PhraseQuery

Фразовый запрос используется для поиска документов, содержащих определенную последовательность терминов.

6 WildCardQuery

WildcardQuery используется для поиска документов с использованием подстановочных знаков, таких как '*', для любой последовательности символов ,? соответствует одному символу.

7 FuzzyQuery

FuzzyQuery используется для поиска документов с использованием нечеткой реализации, которая представляет собой приблизительный поиск, основанный на алгоритме расстояния редактирования.

8 MatchAllDocsQuery

MatchAllDocsQuery, как следует из названия, соответствует всем документам.

В одной из наших предыдущих глав мы видели, что Lucene использует IndexWriter для анализа документов с помощью Analyzer, а затем создает / открывает / редактирует индексы по мере необходимости. В этой главе мы собираемся обсудить различные типы объектов Analyzer и другие соответствующие объекты, которые используются в процессе анализа. Понимание процесса анализа и того, как работают анализаторы, позволит вам лучше понять, как Lucene индексирует документы.

Ниже приводится список объектов, которые мы обсудим в свое время.

S.No. Класс и описание
1 Токен

Токен представляет текст или слово в документе с соответствующими деталями, такими как его метаданные (позиция, начальное смещение, конечное смещение, тип токена и приращение его позиции).

2 TokenStream

TokenStream - это результат процесса анализа, состоящий из серии токенов. Это абстрактный класс.

3 Анализатор

Это абстрактный базовый класс для каждого типа анализатора.

4 WhitespaceAnalyzer

Этот анализатор разбивает текст в документе по пробелам.

5 SimpleAnalyzer

Этот анализатор разбивает текст в документе на небуквенные символы и переводит текст в нижний регистр.

6 StopAnalyzer

Этот анализатор работает так же, как SimpleAnalyzer, и удаляет такие общие слова, как 'a', 'an', 'the', и т.п.

7 Стандартный анализатор

Это наиболее сложный анализатор, способный обрабатывать имена, адреса электронной почты и т. Д. Он переводит каждый токен в нижний регистр и удаляет общие слова и знаки препинания, если они есть.

В этой главе мы рассмотрим порядок сортировки, в котором Lucene выдает результаты поиска по умолчанию или может быть изменен при необходимости.

Сортировка по релевантности

Это режим сортировки по умолчанию, используемый Lucene. Lucene предоставляет результаты по наиболее релевантному результату вверху.

private void sortUsingRelevance(String searchQuery)
   throws IOException, ParseException {
   searcher = new Searcher(indexDir);
   long startTime = System.currentTimeMillis();
   
   //create a term to search file name
   Term term = new Term(LuceneConstants.FILE_NAME, searchQuery);
   //create the term query object
   Query query = new FuzzyQuery(term);
   searcher.setDefaultFieldSortScoring(true, false);
   //do the search
   TopDocs hits = searcher.search(query,Sort.RELEVANCE);
   long endTime = System.currentTimeMillis();

   System.out.println(hits.totalHits +
      " documents found. Time :" + (endTime - startTime) + "ms");
   for(ScoreDoc scoreDoc : hits.scoreDocs) {
      Document doc = searcher.getDocument(scoreDoc);
      System.out.print("Score: "+ scoreDoc.score + " ");
      System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
   }
   searcher.close();
}

Сортировка по IndexOrder

Этот режим сортировки используется Lucene. Здесь первый проиндексированный документ отображается первым в результатах поиска.

private void sortUsingIndex(String searchQuery)
   throws IOException, ParseException {
   searcher = new Searcher(indexDir);
   long startTime = System.currentTimeMillis();
   
   //create a term to search file name
   Term term = new Term(LuceneConstants.FILE_NAME, searchQuery);
   //create the term query object
   Query query = new FuzzyQuery(term);
   searcher.setDefaultFieldSortScoring(true, false);
   //do the search
   TopDocs hits = searcher.search(query,Sort.INDEXORDER);
   long endTime = System.currentTimeMillis();

   System.out.println(hits.totalHits +
      " documents found. Time :" + (endTime - startTime) + "ms");
   for(ScoreDoc scoreDoc : hits.scoreDocs) {
      Document doc = searcher.getDocument(scoreDoc);
      System.out.print("Score: "+ scoreDoc.score + " ");
      System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
   }
   searcher.close();
}

Пример приложения

Давайте создадим тестовое приложение Lucene, чтобы протестировать процесс сортировки.

Шаг Описание
1

Создайте проект с именем LuceneFirstApplication в пакете com.tutorialspoint.lucene, как описано в главе Lucene - Первое приложение . Вы также можете использовать проект, созданный в главе Lucene - Первое приложение, как таковой для этой главы, чтобы понять процесс поиска.

2

Создайте LuceneConstants.java и Searcher.java, как описано в главе Lucene - Первое приложение . Остальные файлы оставьте без изменений.

3

Создайте LuceneTester.java, как указано ниже.

4

Очистите и соберите приложение, чтобы убедиться, что бизнес-логика работает в соответствии с требованиями.

LuceneConstants.java

Этот класс используется для предоставления различных констант для использования в примере приложения.

package com.tutorialspoint.lucene;

public class LuceneConstants {
   public static final String CONTENTS = "contents";
   public static final String FILE_NAME = "filename";
   public static final String FILE_PATH = "filepath";
   public static final int MAX_SEARCH = 10;
}

Searcher.java

Этот класс используется для чтения индексов, сделанных на необработанных данных, и поиска данных с помощью библиотеки Lucene.

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class Searcher {
	
IndexSearcher indexSearcher;
   QueryParser queryParser;
   Query query;

   public Searcher(String indexDirectoryPath) throws IOException {
      Directory indexDirectory 
         = FSDirectory.open(new File(indexDirectoryPath));
      indexSearcher = new IndexSearcher(indexDirectory);
      queryParser = new QueryParser(Version.LUCENE_36,
         LuceneConstants.CONTENTS,
         new StandardAnalyzer(Version.LUCENE_36));
   }

   public TopDocs search( String searchQuery) 
      throws IOException, ParseException {
      query = queryParser.parse(searchQuery);
      return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
   }

   public TopDocs search(Query query) 
      throws IOException, ParseException {
      return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
   }

   public TopDocs search(Query query,Sort sort) 
      throws IOException, ParseException {
      return indexSearcher.search(query, 
         LuceneConstants.MAX_SEARCH,sort);
   }

   public void setDefaultFieldSortScoring(boolean doTrackScores, 
      boolean doMaxScores) {
      indexSearcher.setDefaultFieldSortScoring(
         doTrackScores,doMaxScores);
   }

   public Document getDocument(ScoreDoc scoreDoc) 
      throws CorruptIndexException, IOException {
      return indexSearcher.doc(scoreDoc.doc);	
   }

   public void close() throws IOException {
      indexSearcher.close();
   }
}

LuceneTester.java

Этот класс используется для проверки возможности поиска библиотеки Lucene.

package com.tutorialspoint.lucene;

import java.io.IOException;

import org.apache.lucene.document.Document;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.search.FuzzyQuery;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.TopDocs;

public class LuceneTester {
	
   String indexDir = "E:\\Lucene\\Index";
   String dataDir = "E:\\Lucene\\Data";
   Indexer indexer;
   Searcher searcher;

   public static void main(String[] args) {
      LuceneTester tester;
      try {
          tester = new LuceneTester();
          tester.sortUsingRelevance("cord3.txt");
          tester.sortUsingIndex("cord3.txt");
      } catch (IOException e) {
          e.printStackTrace();
      } catch (ParseException e) {
          e.printStackTrace();
      }		
   }

   private void sortUsingRelevance(String searchQuery)
      throws IOException, ParseException {
      searcher = new Searcher(indexDir);
      long startTime = System.currentTimeMillis();
      
      //create a term to search file name
      Term term = new Term(LuceneConstants.FILE_NAME, searchQuery);
      //create the term query object
      Query query = new FuzzyQuery(term);
      searcher.setDefaultFieldSortScoring(true, false);
      //do the search
      TopDocs hits = searcher.search(query,Sort.RELEVANCE);
      long endTime = System.currentTimeMillis();

      System.out.println(hits.totalHits +
         " documents found. Time :" + (endTime - startTime) + "ms");
      for(ScoreDoc scoreDoc : hits.scoreDocs) {
         Document doc = searcher.getDocument(scoreDoc);
         System.out.print("Score: "+ scoreDoc.score + " ");
         System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
      }
      searcher.close();
   }

   private void sortUsingIndex(String searchQuery)
      throws IOException, ParseException {
      searcher = new Searcher(indexDir);
      long startTime = System.currentTimeMillis();
      //create a term to search file name
      Term term = new Term(LuceneConstants.FILE_NAME, searchQuery);
      //create the term query object
      Query query = new FuzzyQuery(term);
      searcher.setDefaultFieldSortScoring(true, false);
      //do the search
      TopDocs hits = searcher.search(query,Sort.INDEXORDER);
      long endTime = System.currentTimeMillis();

      System.out.println(hits.totalHits +
      " documents found. Time :" + (endTime - startTime) + "ms");
      for(ScoreDoc scoreDoc : hits.scoreDocs) {
         Document doc = searcher.getDocument(scoreDoc);
         System.out.print("Score: "+ scoreDoc.score + " ");
         System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
      }
      searcher.close();
   }
}

Создание каталога данных и индекса

Мы использовали 10 текстовых файлов от record1.txt до record10.txt, содержащих имена и другие данные об учениках, и поместили их в каталог. E:\Lucene\Data. Данные испытаний . Путь к каталогу индекса должен быть создан как E: \ Lucene \ Index. После запуска программы индексации в главеLucene - Indexing Process, вы можете увидеть список индексных файлов, созданных в этой папке.

Запуск программы

Когда вы закончите создание источника, необработанных данных, каталога данных, каталога индексов и индексов, вы можете скомпилировать и запустить свою программу. Для этого оставьтеLuceneTester.Java активна вкладка файла и используйте либо опцию Run, доступную в Eclipse IDE, либо используйте Ctrl + F11 скомпилировать и запустить ваш LuceneTesterприменение. Если ваше приложение работает успешно, оно напечатает следующее сообщение в консоли Eclipse IDE:

10 documents found. Time :31ms
Score: 1.3179655 File: E:\Lucene\Data\record3.txt
Score: 0.790779 File: E:\Lucene\Data\record1.txt
Score: 0.790779 File: E:\Lucene\Data\record2.txt
Score: 0.790779 File: E:\Lucene\Data\record4.txt
Score: 0.790779 File: E:\Lucene\Data\record5.txt
Score: 0.790779 File: E:\Lucene\Data\record6.txt
Score: 0.790779 File: E:\Lucene\Data\record7.txt
Score: 0.790779 File: E:\Lucene\Data\record8.txt
Score: 0.790779 File: E:\Lucene\Data\record9.txt
Score: 0.2635932 File: E:\Lucene\Data\record10.txt
10 documents found. Time :0ms
Score: 0.790779 File: E:\Lucene\Data\record1.txt
Score: 0.2635932 File: E:\Lucene\Data\record10.txt
Score: 0.790779 File: E:\Lucene\Data\record2.txt
Score: 1.3179655 File: E:\Lucene\Data\record3.txt
Score: 0.790779 File: E:\Lucene\Data\record4.txt
Score: 0.790779 File: E:\Lucene\Data\record5.txt
Score: 0.790779 File: E:\Lucene\Data\record6.txt
Score: 0.790779 File: E:\Lucene\Data\record7.txt
Score: 0.790779 File: E:\Lucene\Data\record8.txt
Score: 0.790779 File: E:\Lucene\Data\record9.txt