ल्यूसिने - छँटाई

इस अध्याय में, हम उस क्रमबद्ध क्रम में देखेंगे जिसमें ल्यूसिन डिफ़ॉल्ट रूप से खोज परिणाम देता है या आवश्यकतानुसार उसमें हेरफेर किया जा सकता है।

प्रासंगिकता द्वारा क्रमबद्ध करना

यह Lucene द्वारा उपयोग किया जाने वाला डिफ़ॉल्ट सॉर्टिंग मोड है। ल्यूसिन शीर्ष पर सबसे अधिक प्रासंगिक हिट द्वारा परिणाम प्रदान करता है।

private void sortUsingRelevance(String searchQuery)
   throws IOException, ParseException {
   searcher = new Searcher(indexDir);
   long startTime = System.currentTimeMillis();
   
   //create a term to search file name
   Term term = new Term(LuceneConstants.FILE_NAME, searchQuery);
   //create the term query object
   Query query = new FuzzyQuery(term);
   searcher.setDefaultFieldSortScoring(true, false);
   //do the search
   TopDocs hits = searcher.search(query,Sort.RELEVANCE);
   long endTime = System.currentTimeMillis();

   System.out.println(hits.totalHits +
      " documents found. Time :" + (endTime - startTime) + "ms");
   for(ScoreDoc scoreDoc : hits.scoreDocs) {
      Document doc = searcher.getDocument(scoreDoc);
      System.out.print("Score: "+ scoreDoc.score + " ");
      System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
   }
   searcher.close();
}

IndexOrder द्वारा छंटनी

इस सॉर्टिंग मोड का उपयोग ल्यूसिने द्वारा किया जाता है। यहां, खोजे गए परिणामों में पहला दस्तावेज अनुक्रमित पहले दिखाया गया है।

private void sortUsingIndex(String searchQuery)
   throws IOException, ParseException {
   searcher = new Searcher(indexDir);
   long startTime = System.currentTimeMillis();
   
   //create a term to search file name
   Term term = new Term(LuceneConstants.FILE_NAME, searchQuery);
   //create the term query object
   Query query = new FuzzyQuery(term);
   searcher.setDefaultFieldSortScoring(true, false);
   //do the search
   TopDocs hits = searcher.search(query,Sort.INDEXORDER);
   long endTime = System.currentTimeMillis();

   System.out.println(hits.totalHits +
      " documents found. Time :" + (endTime - startTime) + "ms");
   for(ScoreDoc scoreDoc : hits.scoreDocs) {
      Document doc = searcher.getDocument(scoreDoc);
      System.out.print("Score: "+ scoreDoc.score + " ");
      System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
   }
   searcher.close();
}

उदाहरण अनुप्रयोग

आइए हम छँटाई प्रक्रिया का परीक्षण करने के लिए एक परीक्षण ल्यूसीन एप्लिकेशन बनाएं।

कदम विवरण
1

एक पैकेज के तहत LuceneFirstApplication नाम के साथ एक प्रोजेक्ट बनाएं । Lucene - First Application Chapter में बताया गया है । आप खोज प्रक्रिया को समझने के लिए ल्यूसीन - फर्स्ट एप्लीकेशन चैप्टर जैसे कि इस चैप्टर के लिए बनाई गई परियोजना का भी उपयोग कर सकते हैं ।

2

LuceneConstants.java और Searcher.java बनाएँ जैसा कि Lucene - First Application Chapter में बताया गया है । शेष फाइलों को अपरिवर्तित रखें।

3

नीचे बताए अनुसार LuceneTester.java बनाएं ।

4

यह सुनिश्चित करने के लिए कि व्यावसायिक तर्क आवश्यकताओं के अनुसार काम कर रहा है, आवेदन को साफ और निर्मित करें।

LuceneConstants.java

इस वर्ग का उपयोग विभिन्न स्थिरांक प्रदान करने के लिए किया जाता है, जिसका उपयोग नमूना अनुप्रयोग में किया जाता है।

package com.tutorialspoint.lucene;

public class LuceneConstants {
   public static final String CONTENTS = "contents";
   public static final String FILE_NAME = "filename";
   public static final String FILE_PATH = "filepath";
   public static final int MAX_SEARCH = 10;
}

Searcher.java

इस वर्ग का उपयोग कच्चे डेटा पर बने इंडेक्स को पढ़ने के लिए किया जाता है और ल्यूसिन लाइब्रेरी का उपयोग करके डेटा की खोज करता है।

package com.tutorialspoint.lucene;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.CorruptIndexException;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class Searcher {
	
IndexSearcher indexSearcher;
   QueryParser queryParser;
   Query query;

   public Searcher(String indexDirectoryPath) throws IOException {
      Directory indexDirectory 
         = FSDirectory.open(new File(indexDirectoryPath));
      indexSearcher = new IndexSearcher(indexDirectory);
      queryParser = new QueryParser(Version.LUCENE_36,
         LuceneConstants.CONTENTS,
         new StandardAnalyzer(Version.LUCENE_36));
   }

   public TopDocs search( String searchQuery) 
      throws IOException, ParseException {
      query = queryParser.parse(searchQuery);
      return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
   }

   public TopDocs search(Query query) 
      throws IOException, ParseException {
      return indexSearcher.search(query, LuceneConstants.MAX_SEARCH);
   }

   public TopDocs search(Query query,Sort sort) 
      throws IOException, ParseException {
      return indexSearcher.search(query, 
         LuceneConstants.MAX_SEARCH,sort);
   }

   public void setDefaultFieldSortScoring(boolean doTrackScores, 
      boolean doMaxScores) {
      indexSearcher.setDefaultFieldSortScoring(
         doTrackScores,doMaxScores);
   }

   public Document getDocument(ScoreDoc scoreDoc) 
      throws CorruptIndexException, IOException {
      return indexSearcher.doc(scoreDoc.doc);	
   }

   public void close() throws IOException {
      indexSearcher.close();
   }
}

LuceneTester.java

इस वर्ग का उपयोग ल्यूसिन पुस्तकालय की खोज क्षमता का परीक्षण करने के लिए किया जाता है।

package com.tutorialspoint.lucene;

import java.io.IOException;

import org.apache.lucene.document.Document;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryParser.ParseException;
import org.apache.lucene.search.FuzzyQuery;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.TopDocs;

public class LuceneTester {
	
   String indexDir = "E:\\Lucene\\Index";
   String dataDir = "E:\\Lucene\\Data";
   Indexer indexer;
   Searcher searcher;

   public static void main(String[] args) {
      LuceneTester tester;
      try {
          tester = new LuceneTester();
          tester.sortUsingRelevance("cord3.txt");
          tester.sortUsingIndex("cord3.txt");
      } catch (IOException e) {
          e.printStackTrace();
      } catch (ParseException e) {
          e.printStackTrace();
      }		
   }

   private void sortUsingRelevance(String searchQuery)
      throws IOException, ParseException {
      searcher = new Searcher(indexDir);
      long startTime = System.currentTimeMillis();
      
      //create a term to search file name
      Term term = new Term(LuceneConstants.FILE_NAME, searchQuery);
      //create the term query object
      Query query = new FuzzyQuery(term);
      searcher.setDefaultFieldSortScoring(true, false);
      //do the search
      TopDocs hits = searcher.search(query,Sort.RELEVANCE);
      long endTime = System.currentTimeMillis();

      System.out.println(hits.totalHits +
         " documents found. Time :" + (endTime - startTime) + "ms");
      for(ScoreDoc scoreDoc : hits.scoreDocs) {
         Document doc = searcher.getDocument(scoreDoc);
         System.out.print("Score: "+ scoreDoc.score + " ");
         System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
      }
      searcher.close();
   }

   private void sortUsingIndex(String searchQuery)
      throws IOException, ParseException {
      searcher = new Searcher(indexDir);
      long startTime = System.currentTimeMillis();
      //create a term to search file name
      Term term = new Term(LuceneConstants.FILE_NAME, searchQuery);
      //create the term query object
      Query query = new FuzzyQuery(term);
      searcher.setDefaultFieldSortScoring(true, false);
      //do the search
      TopDocs hits = searcher.search(query,Sort.INDEXORDER);
      long endTime = System.currentTimeMillis();

      System.out.println(hits.totalHits +
      " documents found. Time :" + (endTime - startTime) + "ms");
      for(ScoreDoc scoreDoc : hits.scoreDocs) {
         Document doc = searcher.getDocument(scoreDoc);
         System.out.print("Score: "+ scoreDoc.score + " ");
         System.out.println("File: "+ doc.get(LuceneConstants.FILE_PATH));
      }
      searcher.close();
   }
}

डेटा और इंडेक्स डायरेक्टरी क्रिएशन

हमने record1.txt से record10.txt के 10 पाठ फ़ाइलों का उपयोग किया है जिसमें छात्रों के नाम और अन्य विवरण हैं और उन्हें निर्देशिका में रखा गया है E:\Lucene\Data. डेटा का परीक्षण करें । अनुक्रमणिका निर्देशिका पथ को E: \ Lucene \ Index के रूप में बनाया जाना चाहिए। अध्याय में अनुक्रमण कार्यक्रम चलाने के बादLucene - Indexing Process, आप उस फ़ोल्डर में बनाई गई सूचकांक फ़ाइलों की सूची देख सकते हैं।

कार्यक्रम चला रहा है

एक बार जब आप स्रोत, कच्चे डेटा, डेटा निर्देशिका, इंडेक्स डायरेक्टरी और इंडेक्स के निर्माण के साथ हो जाते हैं, तो आप अपने प्रोग्राम को संकलित और चला सकते हैं। ऐसा करने के लिए, रखेंLuceneTester.Java फ़ाइल टैब सक्रिय है और या तो ग्रहण आईडीई में उपलब्ध रन विकल्प का उपयोग करें या उपयोग करें Ctrl + F11 संकलन करने और चलाने के लिए LuceneTesterआवेदन। यदि आपका आवेदन सफलतापूर्वक चलता है, तो यह ग्रहण आईडीई के कंसोल में निम्न संदेश को प्रिंट करेगा -

10 documents found. Time :31ms
Score: 1.3179655 File: E:\Lucene\Data\record3.txt
Score: 0.790779 File: E:\Lucene\Data\record1.txt
Score: 0.790779 File: E:\Lucene\Data\record2.txt
Score: 0.790779 File: E:\Lucene\Data\record4.txt
Score: 0.790779 File: E:\Lucene\Data\record5.txt
Score: 0.790779 File: E:\Lucene\Data\record6.txt
Score: 0.790779 File: E:\Lucene\Data\record7.txt
Score: 0.790779 File: E:\Lucene\Data\record8.txt
Score: 0.790779 File: E:\Lucene\Data\record9.txt
Score: 0.2635932 File: E:\Lucene\Data\record10.txt
10 documents found. Time :0ms
Score: 0.790779 File: E:\Lucene\Data\record1.txt
Score: 0.2635932 File: E:\Lucene\Data\record10.txt
Score: 0.790779 File: E:\Lucene\Data\record2.txt
Score: 1.3179655 File: E:\Lucene\Data\record3.txt
Score: 0.790779 File: E:\Lucene\Data\record4.txt
Score: 0.790779 File: E:\Lucene\Data\record5.txt
Score: 0.790779 File: E:\Lucene\Data\record6.txt
Score: 0.790779 File: E:\Lucene\Data\record7.txt
Score: 0.790779 File: E:\Lucene\Data\record8.txt
Score: 0.790779 File: E:\Lucene\Data\record9.txt