Apache Solr - podstawy wyszukiwarki

Wyszukiwarka odnosi się do ogromnej bazy danych zasobów internetowych, takich jak strony internetowe, grupy dyskusyjne, programy, obrazy itp. Pomaga zlokalizować informacje w sieci WWW.

Użytkownicy mogą wyszukiwać informacje, przesyłając zapytania do wyszukiwarki w postaci słów kluczowych lub fraz. Wyszukiwarka przeszukuje następnie swoją bazę danych i zwraca użytkownikowi odpowiednie linki.

Komponenty wyszukiwarek

Ogólnie rzecz biorąc, istnieją trzy podstawowe elementy wyszukiwarki wymienione poniżej -

  • Web Crawler - Przeszukiwacze sieci są również znane jako spiders lub bots. Jest to komponent oprogramowania, który przeszukuje sieć w celu zebrania informacji.

  • Database- Wszystkie informacje w sieci są przechowywane w bazach danych. Zawierają ogromną ilość zasobów sieciowych.

  • Search Interfaces- Ten komponent jest interfejsem między użytkownikiem a bazą danych. Pomaga użytkownikowi przeszukiwać bazę danych.

Jak działają wyszukiwarki?

Do wykonania niektórych lub wszystkich poniższych operacji wymagana jest dowolna aplikacja wyszukująca.

Krok Tytuł Opis

1

Zdobądź surową zawartość

Pierwszym krokiem każdej aplikacji wyszukującej jest zebranie docelowej treści, na której ma zostać przeprowadzone wyszukiwanie.

2

Zbuduj dokument

Następnym krokiem jest zbudowanie dokumentu (ów) z surowej treści, którą aplikacja wyszukująca może łatwo zrozumieć i zinterpretować.

3

Przeanalizuj dokument

Przed przystąpieniem do indeksowania dokument należy przeanalizować.

4

Indeksowanie dokumentu

Po zbudowaniu i przeanalizowaniu dokumentów następnym krokiem jest ich indeksowanie, aby można było pobrać ten dokument na podstawie określonych kluczy, a nie całej zawartości dokumentu.

Indeksowanie jest podobne do indeksów, które mamy na końcu książki, w których typowe słowa są wyświetlane wraz z numerami stron, dzięki czemu można je szybko prześledzić, zamiast przeszukiwać całą książkę.

5

Interfejs użytkownika do wyszukiwania

Gdy baza indeksów jest już gotowa, aplikacja może wykonywać operacje wyszukiwania. Aby ułatwić użytkownikowi wyszukiwanie, aplikacja musi zapewniać interfejs użytkownika, w którym użytkownik może wprowadzać tekst i inicjować proces wyszukiwania

6

Utwórz zapytanie

Gdy użytkownik zgłosi żądanie wyszukania tekstu, aplikacja powinna przygotować obiekt zapytania wykorzystujący ten tekst, który następnie może zostać wykorzystany do odpytania bazy danych indeksu w celu uzyskania odpowiednich informacji.

7

Wyszukiwana fraza

Przy użyciu obiektu zapytania sprawdzana jest baza danych indeksu w celu uzyskania odpowiednich szczegółów i dokumentów treści.

8

Wyniki renderowania

Po otrzymaniu wymaganego wyniku aplikacja powinna zdecydować, jak wyświetlić wyniki użytkownikowi za pomocą interfejsu użytkownika.

Spójrz na poniższą ilustrację. Przedstawia ogólny obraz funkcjonowania wyszukiwarek.

Oprócz tych podstawowych operacji aplikacje wyszukujące mogą również udostępniać interfejs administratora i użytkownika, pomagając administratorom kontrolować poziom wyszukiwania w oparciu o profile użytkowników. Analiza wyników wyszukiwania to kolejny ważny i zaawansowany aspekt każdej aplikacji wyszukującej.