Apache Solr - podstawy wyszukiwarki
Wyszukiwarka odnosi się do ogromnej bazy danych zasobów internetowych, takich jak strony internetowe, grupy dyskusyjne, programy, obrazy itp. Pomaga zlokalizować informacje w sieci WWW.
Użytkownicy mogą wyszukiwać informacje, przesyłając zapytania do wyszukiwarki w postaci słów kluczowych lub fraz. Wyszukiwarka przeszukuje następnie swoją bazę danych i zwraca użytkownikowi odpowiednie linki.
Komponenty wyszukiwarek
Ogólnie rzecz biorąc, istnieją trzy podstawowe elementy wyszukiwarki wymienione poniżej -
Web Crawler - Przeszukiwacze sieci są również znane jako spiders lub bots. Jest to komponent oprogramowania, który przeszukuje sieć w celu zebrania informacji.
Database- Wszystkie informacje w sieci są przechowywane w bazach danych. Zawierają ogromną ilość zasobów sieciowych.
Search Interfaces- Ten komponent jest interfejsem między użytkownikiem a bazą danych. Pomaga użytkownikowi przeszukiwać bazę danych.
Jak działają wyszukiwarki?
Do wykonania niektórych lub wszystkich poniższych operacji wymagana jest dowolna aplikacja wyszukująca.
Krok | Tytuł | Opis |
---|---|---|
1 |
Zdobądź surową zawartość |
Pierwszym krokiem każdej aplikacji wyszukującej jest zebranie docelowej treści, na której ma zostać przeprowadzone wyszukiwanie. |
2 |
Zbuduj dokument |
Następnym krokiem jest zbudowanie dokumentu (ów) z surowej treści, którą aplikacja wyszukująca może łatwo zrozumieć i zinterpretować. |
3 |
Przeanalizuj dokument |
Przed przystąpieniem do indeksowania dokument należy przeanalizować. |
4 |
Indeksowanie dokumentu |
Po zbudowaniu i przeanalizowaniu dokumentów następnym krokiem jest ich indeksowanie, aby można było pobrać ten dokument na podstawie określonych kluczy, a nie całej zawartości dokumentu. Indeksowanie jest podobne do indeksów, które mamy na końcu książki, w których typowe słowa są wyświetlane wraz z numerami stron, dzięki czemu można je szybko prześledzić, zamiast przeszukiwać całą książkę. |
5 |
Interfejs użytkownika do wyszukiwania |
Gdy baza indeksów jest już gotowa, aplikacja może wykonywać operacje wyszukiwania. Aby ułatwić użytkownikowi wyszukiwanie, aplikacja musi zapewniać interfejs użytkownika, w którym użytkownik może wprowadzać tekst i inicjować proces wyszukiwania |
6 |
Utwórz zapytanie |
Gdy użytkownik zgłosi żądanie wyszukania tekstu, aplikacja powinna przygotować obiekt zapytania wykorzystujący ten tekst, który następnie może zostać wykorzystany do odpytania bazy danych indeksu w celu uzyskania odpowiednich informacji. |
7 |
Wyszukiwana fraza |
Przy użyciu obiektu zapytania sprawdzana jest baza danych indeksu w celu uzyskania odpowiednich szczegółów i dokumentów treści. |
8 |
Wyniki renderowania |
Po otrzymaniu wymaganego wyniku aplikacja powinna zdecydować, jak wyświetlić wyniki użytkownikowi za pomocą interfejsu użytkownika. |
Spójrz na poniższą ilustrację. Przedstawia ogólny obraz funkcjonowania wyszukiwarek.
Oprócz tych podstawowych operacji aplikacje wyszukujące mogą również udostępniać interfejs administratora i użytkownika, pomagając administratorom kontrolować poziom wyszukiwania w oparciu o profile użytkowników. Analiza wyników wyszukiwania to kolejny ważny i zaawansowany aspekt każdej aplikacji wyszukującej.