Apache Solr - Übersicht
Solr ist eine Open-Source-Suchplattform, die zum Erstellen verwendet wird search applications. Es wurde darauf gebautLucene(Volltextsuchmaschine). Solr ist unternehmensfähig, schnell und hoch skalierbar. Die mit Solr erstellten Anwendungen sind hochentwickelt und bieten eine hohe Leistung.
Es war Yonik Seelyder Solr im Jahr 2004 erstellt hat, um der Unternehmenswebsite von CNET Networks Suchfunktionen hinzuzufügen. Im Januar 2006 wurde es ein Open-Source-Projekt unter Apache Software Foundation gemacht. Die neueste Version, Solr 6.0, wurde 2016 mit Unterstützung für die Ausführung paralleler SQL-Abfragen veröffentlicht.
Solr kann zusammen mit Hadoop verwendet werden. Da Hadoop eine große Datenmenge verarbeitet, hilft uns Solr dabei, die erforderlichen Informationen aus einer so großen Quelle zu finden. Solr kann nicht nur gesucht, sondern auch zu Speicherzwecken verwendet werden. Wie andere NoSQL-Datenbanken ist es einenon-relational data storage und processing technology.
Kurz gesagt, Solr ist eine skalierbare, einsatzbereite Such- / Speichermaschine, die für die Suche nach großen Mengen textzentrierter Daten optimiert ist.
Funktionen von Apache Solr
Solr ist eine Zusammenfassung der Java-API von Lucene. Daher können Sie mit Solr alle Funktionen von Lucene nutzen. Werfen wir einen Blick auf einige der wichtigsten Merkmale von Solr -
Restful APIs- Für die Kommunikation mit Solr sind keine Java-Programmierkenntnisse erforderlich. Stattdessen können Sie erholsame Dienste verwenden, um mit ihm zu kommunizieren. Wir geben Dokumente in Solr in Dateiformaten wie XML, JSON und .CSV ein und erhalten Ergebnisse in denselben Dateiformaten.
Full text search - Solr bietet alle Funktionen, die für eine Volltextsuche erforderlich sind, z. B. Token, Phrasen, Rechtschreibprüfung, Platzhalter und automatische Vervollständigung.
Enterprise ready - Je nach Bedarf der Organisation kann Solr in jeder Art von System (groß oder klein) wie Standalone, verteilt, Cloud usw. bereitgestellt werden.
Flexible and Extensible - Durch Erweitern der Java-Klassen und entsprechende Konfiguration können wir die Komponenten von Solr einfach anpassen.
NoSQL database - Solr kann auch als NOSQL-Datenbank im Big-Data-Maßstab verwendet werden, in der wir die Suchaufgaben entlang eines Clusters verteilen können.
Admin Interface - Solr bietet eine benutzerfreundliche, benutzerfreundliche, funktionsbasierte Benutzeroberfläche, über die wir alle möglichen Aufgaben wie das Verwalten von Protokollen, das Hinzufügen, Löschen, Aktualisieren und Durchsuchen von Dokumenten ausführen können.
Highly Scalable - Während Sie Solr mit Hadoop verwenden, können Sie die Kapazität durch Hinzufügen von Replikaten skalieren.
Text-Centric and Sorted by Relevance - Solr wird meistens zum Durchsuchen von Textdokumenten verwendet und die Ergebnisse werden entsprechend der Relevanz für die Abfrage des Benutzers in der angegebenen Reihenfolge geliefert.
Im Gegensatz zu Lucene benötigen Sie keine Java-Programmierkenntnisse, wenn Sie mit Apache Solr arbeiten. Es bietet einen wunderbaren einsatzbereiten Service zum Erstellen eines Suchfelds mit automatischer Vervollständigung, das Lucene nicht bietet. Mit Solr können wir Indizes für große Anwendungen (Big Data) skalieren, verteilen und verwalten.
Lucene in Suchanwendungen
Lucene ist eine einfache, aber leistungsstarke Java-basierte Suchbibliothek. Es kann in jeder Anwendung verwendet werden, um Suchfunktionen hinzuzufügen. Lucene ist eine skalierbare und leistungsstarke Bibliothek, mit der praktisch jede Art von Text indiziert und durchsucht werden kann. Die Lucene-Bibliothek bietet die Kernoperationen, die für jede Suchanwendung erforderlich sind, zIndexing und Searching.
Wenn wir ein Webportal mit einem großen Datenvolumen haben, benötigen wir höchstwahrscheinlich eine Suchmaschine in unserem Portal, um relevante Informationen aus dem riesigen Datenpool zu extrahieren. Lucene ist das Herzstück jeder Suchanwendung und bietet die wichtigsten Funktionen für die Indizierung und Suche.