Motori di ricerca

introduzione

Search Engine fa riferimento a un enorme database di risorse Internet come pagine web, newsgroup, programmi, immagini ecc. Aiuta a localizzare le informazioni sul World Wide Web.

L'utente può cercare qualsiasi informazione passando la query sotto forma di parole chiave o frase. Quindi cerca le informazioni rilevanti nel suo database e torna all'utente.

Componenti del motore di ricerca

In genere ci sono tre componenti di base di un motore di ricerca come elencato di seguito:

  1. Web Crawler

  2. Database

  3. Interfacce di ricerca

Web crawler

È anche conosciuto come spider o bots. È un componente software che attraversa il Web per raccogliere informazioni.

Banca dati

Tutte le informazioni sul web sono archiviate nel database. Consiste di enormi risorse web.

Interfacce di ricerca

Questo componente è un'interfaccia tra l'utente e il database. Aiuta l'utente a cercare nel database.

Motore di ricerca funzionante

Il web crawler, il database e l'interfaccia di ricerca sono i componenti principali di un motore di ricerca che fa funzionare il motore di ricerca. I motori di ricerca utilizzano l'espressione booleana AND, OR, NOT per limitare e ampliare i risultati di una ricerca. Di seguito sono riportati i passaggi che vengono eseguiti dal motore di ricerca:

  • Il motore di ricerca cerca la parola chiave nell'indice del database predefinito invece di andare direttamente sul Web per cercare la parola chiave.

  • Quindi utilizza il software per cercare le informazioni nel database. Questo componente software è noto come web crawler.

  • Una volta che il web crawler trova le pagine, il motore di ricerca mostra quindi le pagine web pertinenti. Queste pagine web recuperate generalmente includono il titolo della pagina, la dimensione della porzione di testo, le prime diverse frasi ecc.

Questi criteri di ricerca possono variare da un motore di ricerca all'altro. Le informazioni recuperate vengono classificate in base a vari fattori come la frequenza delle parole chiave, la pertinenza delle informazioni, i collegamenti, ecc.

  • L'utente può fare clic su uno qualsiasi dei risultati della ricerca per aprirlo.

Architettura

L'architettura del motore di ricerca comprende i tre livelli di base elencati di seguito:

  • Raccolta e perfezionamento dei contenuti.

  • Centro di ricerca

  • Interfacce utente e applicazione

Elaborazione del motore di ricerca

Processo di indicizzazione

Il processo di indicizzazione comprende le tre attività seguenti:

  • Acquisizione del testo

  • Trasformazione del testo

  • Creazione dell'indice

Acquisizione del testo

Identifica e archivia i documenti per l'indicizzazione.

Trasformazione del testo

Trasforma il documento in termini o funzionalità di indice.

Creazione dell'indice

Richiede i termini dell'indice creati dalle trasformazioni del testo e crea strutture di dati per supportare la ricerca rapida.

Processo di query

Il processo di query comprende le tre attività seguenti:

  • Interazione dell'utente

  • Ranking

  • Evaluation

Interazione dell'utente

Supporta la creazione e il perfezionamento della query dell'utente e visualizza i risultati.

classifica

Utilizza query e indici per creare elenchi classificati di documenti.

Valutazione

Monitora e misura l'efficacia e l'efficienza. È fatto offline.

Esempi

Di seguito sono riportati i diversi motori di ricerca disponibili oggi:

Motore di ricerca Descrizione
Google In origine si chiamava BackRub. È il motore di ricerca più popolare a livello globale.
Bing È stato lanciato nel 2009 da Microsoft. È l'ultimo motore di ricerca basato sul web che fornisce anche i risultati di Yahoo.
Chiedi È stato lanciato nel 1996 ed era originariamente noto come Ask Jeeves. Include il supporto per corrispondenza, dizionario e domanda di conversazione.
AltaVista È stato lanciato da Digital Equipment Corporation nel 1995. Dal 2003, è alimentato dalla tecnologia Yahoo.
AOL.Search È alimentato da Google.
LYCOS Secondo Media Matrix, è il primo portale Internet 5 e il 13 ° più grande proprietà online.
Alexa È una filiale di Amazon e viene utilizzata per fornire informazioni sul traffico del sito web.