Lucene - przegląd

Lucene to prosty, ale potężny oparty na Javie Searchbiblioteka. Można go używać w dowolnej aplikacji, aby dodać do niej możliwość wyszukiwania. Lucene to projekt open source. Jest skalowalny. Ta wysokowydajna biblioteka służy do indeksowania i wyszukiwania praktycznie każdego rodzaju tekstu. Biblioteka Lucene zapewnia podstawowe operacje wymagane przez każdą aplikację wyszukującą. Indeksowanie i wyszukiwanie.

Jak działa wyszukiwarka?

Aplikacja wyszukująca wykonuje wszystkie lub kilka z następujących operacji -

Krok Tytuł Opis
1

Acquire Raw Content

Pierwszym krokiem każdej aplikacji wyszukującej jest zebranie docelowej treści, na której ma zostać przeprowadzona wyszukiwarka.

2

Build the document

Następnym krokiem jest zbudowanie dokumentu (ów) z surowej treści, którą aplikacja wyszukująca może łatwo zrozumieć i zinterpretować.

3

Analyze the document

Przed przystąpieniem do indeksowania dokument ma zostać przeanalizowany pod kątem tego, która część tekstu jest kandydatem do indeksowania. Na tym procesie dokument jest analizowany.

4

Indexing the document

Po utworzeniu i przeanalizowaniu dokumentów następnym krokiem jest ich indeksowanie, aby można było pobrać ten dokument na podstawie określonych kluczy zamiast całej treści dokumentu. Proces indeksowania jest podobny do indeksów na końcu książki, w których są wyświetlane popularne słowa wraz z numerami stron, dzięki czemu można je szybko prześledzić zamiast przeszukiwać całą książkę.

5

User Interface for Search

Gdy baza danych indeksów jest już gotowa, aplikacja może przeprowadzić dowolne wyszukiwanie. Aby ułatwić użytkownikowi wyszukiwanie, aplikacja musi udostępniać użytkownikaa mean lub a user interface gdzie użytkownik może wprowadzić tekst i rozpocząć proces wyszukiwania.

6

Build Query

Gdy użytkownik zgłosi żądanie wyszukania tekstu, aplikacja powinna przygotować obiekt Query wykorzystujący ten tekst, który może zostać użyty do zapytania bazy danych indeksu w celu uzyskania odpowiednich szczegółów.

7

Search Query

Korzystając z obiektu zapytania, baza danych indeksu jest następnie sprawdzana w celu uzyskania odpowiednich szczegółów i dokumentów treści.

8

Render Results

Po otrzymaniu wyniku aplikacja powinna zdecydować, jak pokazać wyniki użytkownikowi za pomocą interfejsu użytkownika. Ile informacji ma zostać wyświetlonych na pierwszy rzut oka i tak dalej.

Oprócz tych podstawowych operacji aplikacja wyszukująca może również udostępniać pliki administration user interfacei pomóc administratorom aplikacji kontrolować poziom wyszukiwania w oparciu o profile użytkowników. Analiza wyników wyszukiwania to kolejny ważny i zaawansowany aspekt każdej aplikacji wyszukującej.

Rola Lucene w wyszukiwarce

Lucene odgrywa rolę we wspomnianych powyżej krokach od 2 do 7 i zapewnia klasy do wykonania wymaganych operacji. Krótko mówiąc, Lucene jest sercem każdej aplikacji wyszukującej i zapewnia kluczowe operacje związane z indeksowaniem i wyszukiwaniem. Pozyskanie zawartości i wyświetlenie wyników pozostawia się części aplikacji do obsługi.

W następnym rozdziale przeprowadzimy prostą wyszukiwarkę przy użyciu biblioteki Lucene Search.