Wyszukiwarki

Wprowadzenie

Search Engine odnosi się do ogromnej bazy danych zasobów internetowych, takich jak strony internetowe, grupy dyskusyjne, programy, obrazy itp. Pomaga zlokalizować informacje w sieci WWW.

Użytkownik może wyszukiwać dowolne informacje, przekazując zapytanie w postaci słów kluczowych lub frazy. Następnie wyszukuje odpowiednie informacje w swojej bazie danych i wraca do użytkownika.

Komponenty wyszukiwarek

Ogólnie rzecz biorąc, istnieją trzy podstawowe elementy wyszukiwarki, które wymieniono poniżej:

  1. Robot sieciowy

  2. Database

  3. Wyszukaj interfejsy

Przeszukiwacz sieci

Jest również znany jako spider lub bots. Jest to komponent oprogramowania, który przeszukuje sieć w celu zebrania informacji.

Baza danych

Wszystkie informacje w sieci są przechowywane w bazie danych. Składa się z ogromnych zasobów internetowych.

Wyszukaj interfejsy

Ten komponent jest interfejsem pomiędzy użytkownikiem a bazą danych. Pomaga użytkownikowi przeszukiwać bazę danych.

Wyszukiwarka działa

Przeszukiwacz sieci WWW, baza danych i interfejs wyszukiwania są głównym komponentem wyszukiwarki, który w rzeczywistości umożliwia jej działanie. Wyszukiwarki używają wyrażenia logicznego AND, OR, NOT w celu ograniczenia i poszerzenia wyników wyszukiwania. Oto kroki, które wykonuje wyszukiwarka:

  • Wyszukiwarka szuka słowa kluczowego w indeksie wstępnie zdefiniowanej bazy danych zamiast przechodzić bezpośrednio do sieci w celu wyszukania słowa kluczowego.

  • Następnie wykorzystuje oprogramowanie do wyszukiwania informacji w bazie danych. Ten składnik oprogramowania jest znany jako przeszukiwacz sieci.

  • Gdy robot sieciowy znajdzie strony, wyszukiwarka wyświetli jako wynik odpowiednie strony internetowe. Te pobrane strony internetowe zazwyczaj zawierają tytuł strony, rozmiar fragmentu tekstu, kilka pierwszych zdań itp.

Te kryteria wyszukiwania mogą się różnić w zależności od wyszukiwarki. Pobrane informacje są uszeregowane według różnych czynników, takich jak częstotliwość słów kluczowych, trafność informacji, linki itp.

  • Użytkownik może kliknąć dowolny wynik wyszukiwania, aby go otworzyć.

Architektura

Architektura wyszukiwarki składa się z trzech podstawowych warstw wymienionych poniżej:

  • Gromadzenie i udoskonalanie treści.

  • Wyszukaj rdzeń

  • Interfejsy użytkownika i aplikacji

Przetwarzanie w wyszukiwarkach

Proces indeksowania

Proces indeksowania składa się z trzech następujących zadań:

  • Pozyskiwanie tekstu

  • Transformacja tekstu

  • Tworzenie indeksu

Pozyskiwanie tekstu

Identyfikuje i przechowuje dokumenty do indeksowania.

Transformacja tekstu

Przekształca dokument w terminy lub funkcje indeksu.

Tworzenie indeksu

Zajmuje się terminami indeksu utworzonymi przez transformacje tekstu i tworzy struktury danych w celu wspierania szybkiego wyszukiwania.

Proces zapytania

Proces zapytania obejmuje następujące trzy zadania:

  • Interakcja z użytkownikiem

  • Ranking

  • Evaluation

Interakcja z użytkownikiem

Obsługuje tworzenie i udoskonalanie zapytań użytkownika oraz wyświetla wyniki.

Zaszeregowanie

Używa zapytań i indeksów do tworzenia uporządkowanych list dokumentów.

Ocena

Monitoruje i mierzy skuteczność i wydajność. Odbywa się to offline.

Przykłady

Poniżej znajduje się kilka dostępnych obecnie wyszukiwarek:

Wyszukiwarka Opis
Google Pierwotnie był nazywany BackRub. Jest to najpopularniejsza wyszukiwarka na świecie.
Bing Został uruchomiony w 2009 roku Microsoft. Jest to najnowsza wyszukiwarka internetowa, która dostarcza również wyniki Yahoo.
Zapytać Został uruchomiony w 1996 roku i pierwotnie był znany jako Ask Jeeves. Obejmuje wsparcie dla dopasowania, słownika i pytania do rozmowy.
AltaVista Został uruchomiony przez Digital Equipment Corporation w 1995 roku. Od 2003 jest zasilany przez technologię Yahoo.
AOL. Szukaj Jest zasilany przez Google.
LYCOS Jest to 5 najpopularniejszych portali internetowych i 13. największa nieruchomość online według Media Matrix.
Alexa Jest spółką zależną Amazon i służy do dostarczania informacji o ruchu w witrynie.