Suchmaschinen
Einführung
Search Engine bezieht sich auf eine riesige Datenbank mit Internetressourcen wie Webseiten, Newsgroups, Programmen, Bildern usw. Es hilft, Informationen im World Wide Web zu finden.
Der Benutzer kann nach Informationen suchen, indem er eine Abfrage in Form von Schlüsselwörtern oder Phrasen übergibt. Anschließend sucht es in seiner Datenbank nach relevanten Informationen und kehrt zum Benutzer zurück.
Suchmaschinenkomponenten
Im Allgemeinen gibt es drei grundlegende Komponenten einer Suchmaschine, wie unten aufgeführt:
Web Crawler
Database
Suchschnittstellen
Webcrawler
Es ist auch bekannt als spider oder bots. Es ist eine Softwarekomponente, die das Web durchläuft, um Informationen zu sammeln.
Datenbank
Alle Informationen im Web werden in einer Datenbank gespeichert. Es besteht aus riesigen Webressourcen.
Suchschnittstellen
Diese Komponente ist eine Schnittstelle zwischen Benutzer und Datenbank. Es hilft dem Benutzer, die Datenbank zu durchsuchen.
Suchmaschine funktioniert
Webcrawler, Datenbank und Suchoberfläche sind die Hauptkomponente einer Suchmaschine, mit der die Suchmaschine tatsächlich funktioniert. Suchmaschinen verwenden den Booleschen Ausdruck AND, OR, NOT, um die Ergebnisse einer Suche einzuschränken und zu erweitern. Die folgenden Schritte werden von der Suchmaschine ausgeführt:
Die Suchmaschine sucht nach dem Schlüsselwort im Index für die vordefinierte Datenbank, anstatt direkt ins Web zu gehen, um nach dem Schlüsselwort zu suchen.
Anschließend wird mithilfe von Software nach Informationen in der Datenbank gesucht. Diese Softwarekomponente wird als Webcrawler bezeichnet.
Sobald der Webcrawler die Seiten gefunden hat, zeigt die Suchmaschine die relevanten Webseiten als Ergebnis an. Diese abgerufenen Webseiten enthalten im Allgemeinen den Titel der Seite, die Größe des Textteils, die ersten Sätze usw.
Diese Suchkriterien können von Suchmaschine zu Suchmaschine variieren. Die abgerufenen Informationen werden nach verschiedenen Faktoren wie Häufigkeit von Schlüsselwörtern, Relevanz von Informationen, Links usw. eingestuft.
Der Benutzer kann auf eines der Suchergebnisse klicken, um es zu öffnen.
Die Architektur
Die Suchmaschinenarchitektur besteht aus den drei unten aufgeführten Grundschichten:
Sammlung und Verfeinerung von Inhalten.
Suchkern
Benutzer- und Anwendungsoberflächen
Suchmaschinenverarbeitung
Indizierungsprozess
Der Indizierungsprozess umfasst die folgenden drei Aufgaben:
Texterfassung
Texttransformation
Indexerstellung
Texterfassung
Es identifiziert und speichert Dokumente für die Indizierung.
Texttransformation
Es wandelt Dokumente in Indexbegriffe oder -funktionen um.
Indexerstellung
Es verwendet Indexbegriffe, die durch Texttransformationen erstellt wurden, und erstellt Datenstrukturen, um eine schnelle Suche zu unterstützen.
Abfrageprozess
Der Abfrageprozess umfasst die folgenden drei Aufgaben:
Benutzerinteraktion
Ranking
Evaluation
Benutzerinteraktion
Es unterstützt die Erstellung und Verfeinerung von Benutzerabfragen und zeigt die Ergebnisse an.
Rangfolge
Es verwendet Abfragen und Indizes, um eine Rangliste von Dokumenten zu erstellen.
Auswertung
Es überwacht und misst die Effektivität und Effizienz. Es erfolgt offline.
Beispiele
Im Folgenden sind die verschiedenen Suchmaschinen aufgeführt, die heute verfügbar sind:
Suchmaschine | Beschreibung |
---|---|
Es wurde ursprünglich genannt BackRub. Es ist die weltweit beliebteste Suchmaschine. | |
Bing | Es wurde im Jahr 2009 von gestartet Microsoft. Es ist die neueste webbasierte Suchmaschine, die auch die Ergebnisse von Yahoo liefert. |
Fragen | Es wurde 1996 ins Leben gerufen und war ursprünglich bekannt als Ask Jeeves. Es enthält Unterstützung für Übereinstimmungs-, Wörterbuch- und Konversationsfragen. |
AltaVista | Es wurde von ins Leben gerufen Digital Equipment Corporation 1995. Seit 2003 wird es mit Yahoo-Technologie betrieben. |
AOL.Search | Es wird von Google betrieben. |
LYCOS | Laut Media Matrix ist es das Top 5 Internetportal und die 13. größte Online-Immobilie. |
Alexa | Es ist eine Tochtergesellschaft von Amazon und wird zur Bereitstellung von Website-Verkehrsinformationen verwendet. |