ल्यूसिने - सर्च ऑपरेशन

खोज की प्रक्रिया ल्यूसिने द्वारा प्रदान की गई मुख्य कार्यात्मकताओं में से एक है। निम्नलिखित आरेख प्रक्रिया और इसके उपयोग को दिखाता है। IndexSearcher खोज प्रक्रिया के मुख्य घटकों में से एक है।

हम पहले निर्देशिकाओं को बनाते हैं, जिसमें अनुक्रमणिका होती है और फिर इसे IndexSearcher के पास भेजते हैं जो IndexReader का उपयोग करके निर्देशिका को खोलता है । फिर हम एक शब्द के साथ एक क्वेरी बनाते हैं और खोजकर्ता को क्वेरी पास करके IndexSearcher का उपयोग करके एक खोज करते हैं । IndexSearcher एक रिटर्न TopDocs वस्तु जिनमें से दस्तावेज़ आईडी (रों) के साथ खोज का विवरण होता है दस्तावेज़ जो तलाशी अभियान का परिणाम है।

अब हम आपको एक चरण-वार दृष्टिकोण दिखाएंगे और मूल उदाहरण का उपयोग करके अनुक्रमण प्रक्रिया को समझने में आपकी सहायता करेंगे।

एक QueryParser बनाएँ

QueryParser वर्ग ने उपयोगकर्ता को Lucene समझ में आने वाले प्रारूप क्वेरी में इनपुट दर्ज किया। QueryParser बनाने के लिए इन चरणों का पालन करें -

Step 1 - QueryParser का ऑब्जेक्ट बनाएं।

Step 2 - वर्जन जानकारी और इंडेक्स नाम वाले एक मानक विश्लेषक के साथ बनाई गई क्वेरीपैरसर ऑब्जेक्ट को आरम्भ करें, जिस पर यह क्वेरी चलाई जानी है।

QueryParser queryParser;

public Searcher(String indexDirectoryPath) throws IOException {

   queryParser = new QueryParser(Version.LUCENE_36,
      LuceneConstants.CONTENTS,
      new StandardAnalyzer(Version.LUCENE_36));
}

एक IndexSearcher बनाएँ

IndexSearcher वर्ग एक प्रमुख घटक के रूप में कार्य करता है जो खोजकर्ता अनुक्रमणिका को अनुक्रमण प्रक्रिया के दौरान बनाता है। IndexSearcher बनाने के लिए इन चरणों का पालन करें -

Step 1 - IndexSearcher की ऑब्जेक्ट बनाएं।

Step 2 - एक ल्यूसीन निर्देशिका बनाएं जो उस स्थान को इंगित करे जहां सूचकांक संग्रहीत किए जाने हैं।

Step 3 - अनुक्रमणिका निर्देशिका के साथ बनाई गई IndexSearcher ऑब्जेक्ट को प्रारंभ करें।

IndexSearcher indexSearcher;

public Searcher(String indexDirectoryPath) throws IOException {
   Directory indexDirectory = 
      FSDirectory.open(new File(indexDirectoryPath));
   indexSearcher = new IndexSearcher(indexDirectory);
}

खोज करो

खोज करने के लिए इन चरणों का पालन करें -

Step 1 - QueryParser के माध्यम से खोज अभिव्यक्ति पार्स करके एक क्वेरी ऑब्जेक्ट बनाएं।

Step 2 - IndexSearcher.search () विधि को कॉल करके खोज करें।

Query query;

public TopDocs search( String searchQuery) throws IOException, ParseException {
   query = queryParser.parse(searchQuery);
   return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
}

दस्तावेज़ प्राप्त करें

निम्न प्रोग्राम दिखाता है कि दस्तावेज़ कैसे प्राप्त करें।

public Document getDocument(ScoreDoc scoreDoc) 
   throws CorruptIndexException, IOException {
   return indexSearcher.doc(scoreDoc.doc);	
}

IndexSearcher बंद करें

निम्न प्रोग्राम दिखाता है कि IndexSearcher को कैसे बंद किया जाए।

public void close() throws IOException {
   indexSearcher.close();
}

उदाहरण अनुप्रयोग

आइए हम खोज प्रक्रिया का परीक्षण करने के लिए एक परीक्षण ल्यूसीन एप्लिकेशन बनाएं।

कदम विवरण
1

एक पैकेज के तहत LuceneFirstApplication नाम के साथ एक प्रोजेक्ट बनाएं । Lucene - First Application Chapter में बताया गया है । आप खोज प्रक्रिया को समझने के लिए ल्यूसीन - फर्स्ट एप्लीकेशन चैप्टर जैसे कि इस चैप्टर के लिए बनाई गई परियोजना का भी उपयोग कर सकते हैं ।

2

LuceneConstants.java, TextFileFilter.java और Searcher.java बनाएँ जैसा कि Lucene - First Application Chapter में बताया गया है । शेष फाइलों को अपरिवर्तित रखें।

3

नीचे बताए अनुसार LuceneTester.java बनाएं ।

4

यह सुनिश्चित करने के लिए कि व्यावसायिक लॉजिक आवश्यकताओं के अनुसार काम कर रहा है, स्वच्छ और निर्माण करें।

LuceneConstants.java

इस वर्ग का उपयोग विभिन्न स्थिरांक प्रदान करने के लिए किया जाता है, जिसका उपयोग नमूना अनुप्रयोग में किया जाता है।

package com.tutorialspoint.lucene;

public class LuceneConstants {
   public static final String CONTENTS = "contents";
   public static final String FILE_NAME = "filename";
   public static final String FILE_PATH = "filepath";
   public static final int MAX_SEARCH = 10;
}

TextFileFilter.java

इस वर्ग का उपयोग एक के रूप में किया जाता है .txt फ़ाइल फ़िल्टर।

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.FileFilter;

public class TextFileFilter implements FileFilter {

   @Override
   public boolean accept(File pathname) {
      return pathname.getName().toLowerCase().endsWith(".txt");
   }
}

Searcher.java

इस वर्ग का उपयोग कच्चे डेटा पर बने इंडेक्स को पढ़ने के लिए किया जाता है और ल्यूसिन लाइब्रेरी का उपयोग करके डेटा की खोज करता है।

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class Searcher {
	
   IndexSearcher indexSearcher;
   QueryParser queryParser;
   Query query;

   public Searcher(String indexDirectoryPath) throws IOException {
      Directory indexDirectory = 
         FSDirectory.open(new File(indexDirectoryPath));
      indexSearcher = new IndexSearcher(indexDirectory);
      queryParser = new QueryParser(Version.LUCENE_36,
         LuceneConstants.CONTENTS,
         new StandardAnalyzer(Version.LUCENE_36));
   }

   public TopDocs search( String searchQuery) 
      throws IOException, ParseException {
      query = queryParser.parse(searchQuery);
      return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
   }

   public Document getDocument(ScoreDoc scoreDoc) 
      throws CorruptIndexException, IOException {
      return indexSearcher.doc(scoreDoc.doc);	
   }

   public void close() throws IOException {
      indexSearcher.close();
   }
}

LuceneTester.java

इस वर्ग का उपयोग ल्यूसिन पुस्तकालय की खोज क्षमता का परीक्षण करने के लिए किया जाता है।

package com.tutorialspoint.lucene;

import java.io.IOException;

import org.apache.lucene.document.Document;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;

public class LuceneTester {
	
   String indexDir = "E:\\Lucene\\Index";
   String dataDir = "E:\\Lucene\\Data";
   Searcher searcher;

   public static void main(String[] args) {
      LuceneTester tester;
      try {
         tester = new LuceneTester();
         tester.search("Mohan");
      } catch (IOException e) {
         e.printStackTrace();
      } catch (ParseException e) {
         e.printStackTrace();
      }
   }

   private void search(String searchQuery) throws IOException, ParseException {
      searcher = new Searcher(indexDir);
      long startTime = System.currentTimeMillis();
      TopDocs hits = searcher.search(searchQuery);
      long endTime = System.currentTimeMillis();

      System.out.println(hits.totalHits +
         " documents found. Time :" + (endTime - startTime) +" ms");
      for(ScoreDoc scoreDoc : hits.scoreDocs) {
         Document doc = searcher.getDocument(scoreDoc);
         System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
      }
      searcher.close();
   }	
}

डेटा और इंडेक्स डायरेक्टरी क्रिएशन

हमने 10 पाठ फ़ाइलों को record1.txt के नाम से रिकॉर्ड 10 करने के लिए उपयोग किया है। जिसमें छात्रों के नाम और अन्य विवरण हैं और उन्हें निर्देशिका E: \ Lucene \ Data में डाल दिया है। डेटा का परीक्षण करें । अनुक्रमणिका निर्देशिका पथ को E: \ Lucene \ Index के रूप में बनाया जाना चाहिए। अध्याय में अनुक्रमण कार्यक्रम चलाने के बादLucene - Indexing Process, आप उस फ़ोल्डर में बनाई गई सूचकांक फ़ाइलों की सूची देख सकते हैं।

कार्यक्रम चला रहा है

एक बार जब आप स्रोत, कच्चे डेटा, डेटा निर्देशिका, इंडेक्स डायरेक्टरी और इंडेक्स के निर्माण के साथ हो जाते हैं, तो आप अपने प्रोग्राम को संकलित और चलाकर आगे बढ़ सकते हैं। ऐसा करने के लिए, रखेंLuceneTester.Java फ़ाइल टैब सक्रिय है और या तो ग्रहण आईडीई में उपलब्ध रन विकल्प का उपयोग करें या उपयोग करें Ctrl + F11 संकलन करने और चलाने के लिए LuceneTesterapplication। यदि आपका आवेदन सफलतापूर्वक चलता है, तो यह ग्रहण आईडीई के कंसोल में निम्न संदेश को प्रिंट करेगा -

1 documents found. Time :29 ms
File: E:\Lucene\Data\record4.txt