Motori di ricerca
introduzione
Search Engine fa riferimento a un enorme database di risorse Internet come pagine web, newsgroup, programmi, immagini ecc. Aiuta a localizzare le informazioni sul World Wide Web.
L'utente può cercare qualsiasi informazione passando la query sotto forma di parole chiave o frase. Quindi cerca le informazioni rilevanti nel suo database e torna all'utente.
Componenti del motore di ricerca
In genere ci sono tre componenti di base di un motore di ricerca come elencato di seguito:
Web Crawler
Database
Interfacce di ricerca
Web crawler
È anche conosciuto come spider o bots. È un componente software che attraversa il Web per raccogliere informazioni.
Banca dati
Tutte le informazioni sul web sono archiviate nel database. Consiste di enormi risorse web.
Interfacce di ricerca
Questo componente è un'interfaccia tra l'utente e il database. Aiuta l'utente a cercare nel database.
Motore di ricerca funzionante
Il web crawler, il database e l'interfaccia di ricerca sono i componenti principali di un motore di ricerca che fa funzionare il motore di ricerca. I motori di ricerca utilizzano l'espressione booleana AND, OR, NOT per limitare e ampliare i risultati di una ricerca. Di seguito sono riportati i passaggi che vengono eseguiti dal motore di ricerca:
Il motore di ricerca cerca la parola chiave nell'indice del database predefinito invece di andare direttamente sul Web per cercare la parola chiave.
Quindi utilizza il software per cercare le informazioni nel database. Questo componente software è noto come web crawler.
Una volta che il web crawler trova le pagine, il motore di ricerca mostra quindi le pagine web pertinenti. Queste pagine web recuperate generalmente includono il titolo della pagina, la dimensione della porzione di testo, le prime diverse frasi ecc.
Questi criteri di ricerca possono variare da un motore di ricerca all'altro. Le informazioni recuperate vengono classificate in base a vari fattori come la frequenza delle parole chiave, la pertinenza delle informazioni, i collegamenti, ecc.
L'utente può fare clic su uno qualsiasi dei risultati della ricerca per aprirlo.
Architettura
L'architettura del motore di ricerca comprende i tre livelli di base elencati di seguito:
Raccolta e perfezionamento dei contenuti.
Centro di ricerca
Interfacce utente e applicazione
Elaborazione del motore di ricerca
Processo di indicizzazione
Il processo di indicizzazione comprende le tre attività seguenti:
Acquisizione del testo
Trasformazione del testo
Creazione dell'indice
Acquisizione del testo
Identifica e archivia i documenti per l'indicizzazione.
Trasformazione del testo
Trasforma il documento in termini o funzionalità di indice.
Creazione dell'indice
Richiede i termini dell'indice creati dalle trasformazioni del testo e crea strutture di dati per supportare la ricerca rapida.
Processo di query
Il processo di query comprende le tre attività seguenti:
Interazione dell'utente
Ranking
Evaluation
Interazione dell'utente
Supporta la creazione e il perfezionamento della query dell'utente e visualizza i risultati.
classifica
Utilizza query e indici per creare elenchi classificati di documenti.
Valutazione
Monitora e misura l'efficacia e l'efficienza. È fatto offline.
Esempi
Di seguito sono riportati i diversi motori di ricerca disponibili oggi:
Motore di ricerca | Descrizione |
---|---|
In origine si chiamava BackRub. È il motore di ricerca più popolare a livello globale. | |
Bing | È stato lanciato nel 2009 da Microsoft. È l'ultimo motore di ricerca basato sul web che fornisce anche i risultati di Yahoo. |
Chiedi | È stato lanciato nel 1996 ed era originariamente noto come Ask Jeeves. Include il supporto per corrispondenza, dizionario e domanda di conversazione. |
AltaVista | È stato lanciato da Digital Equipment Corporation nel 1995. Dal 2003, è alimentato dalla tecnologia Yahoo. |
AOL.Search | È alimentato da Google. |
LYCOS | Secondo Media Matrix, è il primo portale Internet 5 e il 13 ° più grande proprietà online. |
Alexa | È una filiale di Amazon e viene utilizzata per fornire informazioni sul traffico del sito web. |