Suchmaschinen

Einführung

Search Engine bezieht sich auf eine riesige Datenbank mit Internetressourcen wie Webseiten, Newsgroups, Programmen, Bildern usw. Es hilft, Informationen im World Wide Web zu finden.

Der Benutzer kann nach Informationen suchen, indem er eine Abfrage in Form von Schlüsselwörtern oder Phrasen übergibt. Anschließend sucht es in seiner Datenbank nach relevanten Informationen und kehrt zum Benutzer zurück.

Suchmaschinenkomponenten

Im Allgemeinen gibt es drei grundlegende Komponenten einer Suchmaschine, wie unten aufgeführt:

  1. Web Crawler

  2. Database

  3. Suchschnittstellen

Webcrawler

Es ist auch bekannt als spider oder bots. Es ist eine Softwarekomponente, die das Web durchläuft, um Informationen zu sammeln.

Datenbank

Alle Informationen im Web werden in einer Datenbank gespeichert. Es besteht aus riesigen Webressourcen.

Suchschnittstellen

Diese Komponente ist eine Schnittstelle zwischen Benutzer und Datenbank. Es hilft dem Benutzer, die Datenbank zu durchsuchen.

Suchmaschine funktioniert

Webcrawler, Datenbank und Suchoberfläche sind die Hauptkomponente einer Suchmaschine, mit der die Suchmaschine tatsächlich funktioniert. Suchmaschinen verwenden den Booleschen Ausdruck AND, OR, NOT, um die Ergebnisse einer Suche einzuschränken und zu erweitern. Die folgenden Schritte werden von der Suchmaschine ausgeführt:

  • Die Suchmaschine sucht nach dem Schlüsselwort im Index für die vordefinierte Datenbank, anstatt direkt ins Web zu gehen, um nach dem Schlüsselwort zu suchen.

  • Anschließend wird mithilfe von Software nach Informationen in der Datenbank gesucht. Diese Softwarekomponente wird als Webcrawler bezeichnet.

  • Sobald der Webcrawler die Seiten gefunden hat, zeigt die Suchmaschine die relevanten Webseiten als Ergebnis an. Diese abgerufenen Webseiten enthalten im Allgemeinen den Titel der Seite, die Größe des Textteils, die ersten Sätze usw.

Diese Suchkriterien können von Suchmaschine zu Suchmaschine variieren. Die abgerufenen Informationen werden nach verschiedenen Faktoren wie Häufigkeit von Schlüsselwörtern, Relevanz von Informationen, Links usw. eingestuft.

  • Der Benutzer kann auf eines der Suchergebnisse klicken, um es zu öffnen.

Die Architektur

Die Suchmaschinenarchitektur besteht aus den drei unten aufgeführten Grundschichten:

  • Sammlung und Verfeinerung von Inhalten.

  • Suchkern

  • Benutzer- und Anwendungsoberflächen

Suchmaschinenverarbeitung

Indizierungsprozess

Der Indizierungsprozess umfasst die folgenden drei Aufgaben:

  • Texterfassung

  • Texttransformation

  • Indexerstellung

Texterfassung

Es identifiziert und speichert Dokumente für die Indizierung.

Texttransformation

Es wandelt Dokumente in Indexbegriffe oder -funktionen um.

Indexerstellung

Es verwendet Indexbegriffe, die durch Texttransformationen erstellt wurden, und erstellt Datenstrukturen, um eine schnelle Suche zu unterstützen.

Abfrageprozess

Der Abfrageprozess umfasst die folgenden drei Aufgaben:

  • Benutzerinteraktion

  • Ranking

  • Evaluation

Benutzerinteraktion

Es unterstützt die Erstellung und Verfeinerung von Benutzerabfragen und zeigt die Ergebnisse an.

Rangfolge

Es verwendet Abfragen und Indizes, um eine Rangliste von Dokumenten zu erstellen.

Auswertung

Es überwacht und misst die Effektivität und Effizienz. Es erfolgt offline.

Beispiele

Im Folgenden sind die verschiedenen Suchmaschinen aufgeführt, die heute verfügbar sind:

Suchmaschine Beschreibung
Google Es wurde ursprünglich genannt BackRub. Es ist die weltweit beliebteste Suchmaschine.
Bing Es wurde im Jahr 2009 von gestartet Microsoft. Es ist die neueste webbasierte Suchmaschine, die auch die Ergebnisse von Yahoo liefert.
Fragen Es wurde 1996 ins Leben gerufen und war ursprünglich bekannt als Ask Jeeves. Es enthält Unterstützung für Übereinstimmungs-, Wörterbuch- und Konversationsfragen.
AltaVista Es wurde von ins Leben gerufen Digital Equipment Corporation 1995. Seit 2003 wird es mit Yahoo-Technologie betrieben.
AOL.Search Es wird von Google betrieben.
LYCOS Laut Media Matrix ist es das Top 5 Internetportal und die 13. größte Online-Immobilie.
Alexa Es ist eine Tochtergesellschaft von Amazon und wird zur Bereitstellung von Website-Verkehrsinformationen verwendet.