Apache Solr - Terminologia
W tym rozdziale postaramy się zrozumieć prawdziwe znaczenie niektórych terminów, które są często używane podczas pracy nad Solr.
Terminologia ogólna
Poniżej znajduje się lista ogólnych terminów używanych we wszystkich typach konfiguracji Solr -
Instance - Tak jak tomcat instance lub a jetty instancetermin ten odnosi się do serwera aplikacji, który działa wewnątrz maszyny JVM. Katalog domowy Solr zawiera odniesienia do każdej z tych instancji Solr, w których jeden lub więcej rdzeni można skonfigurować do działania w każdej instancji.
Core - Podczas uruchamiania wielu indeksów w aplikacji można mieć wiele rdzeni w każdej instancji zamiast wielu instancji z jednym rdzeniem.
Home - Termin $ SOLR_HOME odnosi się do katalogu domowego, który zawiera wszystkie informacje dotyczące rdzeni i ich indeksów, konfiguracji i zależności.
Shard - W środowiskach rozproszonych dane są partycjonowane między wieloma instancjami Solr, gdzie każdy fragment danych można nazwać Shard. Zawiera podzbiór całego indeksu.
Terminologia SolrCloud
We wcześniejszym rozdziale omówiliśmy, jak zainstalować Apache Solr w trybie samodzielnym. Zauważ, że możemy również zainstalować Solr w trybie rozproszonym (środowisko chmurowe), w którym Solr jest zainstalowany we wzorcu master-slave. W trybie rozproszonym indeks jest tworzony na serwerze głównym i replikowany na co najmniej jednym serwerze podrzędnym.
Kluczowe terminy związane z Solr Cloud są następujące -
Node - W chmurze Solr każda pojedyncza instancja Solr jest traktowana jako plik node.
Cluster - Wszystkie węzły środowiska razem tworzą plik cluster.
Collection - Klaster ma indeks logiczny, który jest znany jako collection.
Shard - Fragment to część kolekcji, która ma co najmniej jedną replikę indeksu.
Replica - W Solr Core kopia fragmentu działająca w węźle jest znana jako plik replica.
Leader - Jest to również replika sharda, która rozsyła żądania chmury Solr do pozostałych replik.
Zookeeper - Jest to projekt Apache, który Solr Cloud wykorzystuje do scentralizowanej konfiguracji i koordynacji, do zarządzania klastrem i do wyboru lidera.
Pliki konfiguracyjne
Główne pliki konfiguracyjne w Apache Solr są następujące -
Solr.xml- Jest to plik w katalogu $ SOLR_HOME zawierający informacje związane z Solr Cloud. Aby załadować rdzenie, Solr odwołuje się do tego pliku, co pomaga w ich identyfikacji.
Solrconfig.xml - Ten plik zawiera definicje i specyficzne dla rdzenia konfiguracje związane z obsługą żądań i formatowaniem odpowiedzi, wraz z indeksowaniem, konfigurowaniem, zarządzaniem pamięcią i dokonywaniem zatwierdzeń.
Schema.xml - Ten plik zawiera cały schemat wraz z polami i typami pól.
Core.properties- Ten plik zawiera konfiguracje specyficzne dla rdzenia. Jest określonycore discovery, ponieważ zawiera nazwę rdzenia i ścieżkę katalogu danych. Może być używany w dowolnym katalogu, który będzie wtedy traktowany jako plikcore directory.