Apache Solr - Terminologie

In diesem Kapitel werden wir versuchen, die wahre Bedeutung einiger der Begriffe zu verstehen, die bei der Arbeit an Solr häufig verwendet werden.

Allgemeine Terminologie

Das Folgende ist eine Liste allgemeiner Begriffe, die für alle Arten von Solr-Setups verwendet werden:

  • Instance - Genau wie ein tomcat instance oder ein jetty instanceDieser Begriff bezieht sich auf den Anwendungsserver, der in einer JVM ausgeführt wird. Das Home-Verzeichnis von Solr enthält Verweise auf jede dieser Solr-Instanzen, in denen ein oder mehrere Kerne für die Ausführung in jeder Instanz konfiguriert werden können.

  • Core - Während Sie mehrere Indizes in Ihrer Anwendung ausführen, können Sie in jeder Instanz mehrere Kerne haben, anstatt mehrere Instanzen mit jeweils einem Kern.

  • Home - Der Begriff $ SOLR_HOME bezieht sich auf das Ausgangsverzeichnis, das alle Informationen zu den Kernen und ihren Indizes, Konfigurationen und Abhängigkeiten enthält.

  • Shard - In verteilten Umgebungen werden die Daten auf mehrere Solr-Instanzen aufgeteilt, wobei jeder Datenblock als a aufgerufen werden kann Shard. Es enthält eine Teilmenge des gesamten Index.

SolrCloud-Terminologie

In einem früheren Kapitel haben wir erläutert, wie Apache Solr im Standalone-Modus installiert wird. Beachten Sie, dass wir Solr auch im verteilten Modus (Cloud-Umgebung) installieren können, in dem Solr in einem Master-Slave-Muster installiert ist. Im verteilten Modus wird der Index auf dem Master-Server erstellt und auf einen oder mehrere Slave-Server repliziert.

Die mit Solr Cloud verbundenen Schlüsselbegriffe lauten wie folgt:

  • Node - In der Solr-Cloud wird jede einzelne Instanz von Solr als node.

  • Cluster - Alle Knoten der Umgebung zusammen ergeben a cluster.

  • Collection - Ein Cluster hat einen logischen Index, der als a bezeichnet wird collection.

  • Shard - Ein Shard ist ein Teil der Sammlung, der eine oder mehrere Replikate des Index enthält.

  • Replica - In Solr Core wird eine Kopie des Shards, der in einem Knoten ausgeführt wird, als a bezeichnet replica.

  • Leader - Es ist auch eine Replik von Shard, die die Anforderungen der Solr Cloud an die verbleibenden Replikate verteilt.

  • Zookeeper - Es handelt sich um ein Apache-Projekt, das Solr Cloud zur zentralen Konfiguration und Koordination, zur Verwaltung des Clusters und zur Wahl eines Leiters verwendet.

Konfigurationsdateien

Die Hauptkonfigurationsdateien in Apache Solr lauten wie folgt:

  • Solr.xml- Es ist die Datei im Verzeichnis $ SOLR_HOME, die Informationen zu Solr Cloud enthält. Um die Kerne zu laden, verweist Solr auf diese Datei, die bei der Identifizierung hilft.

  • Solrconfig.xml - Diese Datei enthält die Definitionen und kernspezifischen Konfigurationen für die Bearbeitung von Anforderungen und die Formatierung von Antworten sowie für die Indizierung, Konfiguration, Verwaltung des Speichers und Festschreiben.

  • Schema.xml - Diese Datei enthält das gesamte Schema sowie die Felder und Feldtypen.

  • Core.properties- Diese Datei enthält die für den Kern spezifischen Konfigurationen. Es wird verwiesencore discovery, da es den Namen des Kerns und den Pfad des Datenverzeichnisses enthält. Es kann in jedem Verzeichnis verwendet werden, das dann als das behandelt wirdcore directory.