Apache Solr - Терминология
В этой главе мы попытаемся понять истинное значение некоторых терминов, которые часто используются при работе над Solr.
Общая терминология
Ниже приведен список общих терминов, которые используются во всех типах настроек Solr.
Instance - Прямо как tomcat instance или jetty instance, этот термин относится к серверу приложений, который работает внутри JVM. Домашний каталог Solr предоставляет ссылку на каждый из этих экземпляров Solr, в котором одно или несколько ядер могут быть настроены для работы в каждом экземпляре.
Core - При запуске нескольких индексов в вашем приложении вы можете иметь несколько ядер в каждом экземпляре вместо нескольких экземпляров, каждый из которых имеет одно ядро.
Home - Термин $ SOLR_HOME относится к домашнему каталогу, в котором есть вся информация о ядрах и их индексах, конфигурациях и зависимостях.
Shard - В распределенных средах данные разделены между несколькими экземплярами Solr, где каждый фрагмент данных может называться Shard. Он содержит подмножество всего индекса.
Терминология SolrCloud
В предыдущей главе мы обсуждали, как установить Apache Solr в автономном режиме. Обратите внимание, что мы также можем установить Solr в распределенном режиме (облачная среда), где Solr установлен в шаблоне главный-подчиненный. В распределенном режиме индекс создается на главном сервере и реплицируется на один или несколько подчиненных серверов.
Ключевые термины, связанные с Solr Cloud, следующие:
Node - В облаке Solr каждый отдельный экземпляр Solr рассматривается как node.
Cluster - Все узлы среды вместе составляют cluster.
Collection - У кластера есть логический индекс, известный как collection.
Shard - Осколок - это часть коллекции, которая имеет одну или несколько реплик индекса.
Replica - В Solr Core копия осколка, работающая в узле, известна как replica.
Leader - Это также реплика шарда, который распределяет запросы Solr Cloud на оставшиеся реплики.
Zookeeper - Это проект Apache, который Solr Cloud использует для централизованной конфигурации и координации, управления кластером и выбора лидера.
Файлы конфигурации
Основные файлы конфигурации в Apache Solr следующие:
Solr.xml- Это файл в каталоге $ SOLR_HOME, который содержит информацию, связанную с Solr Cloud. Чтобы загрузить ядра, Solr обращается к этому файлу, который помогает их идентифицировать.
Solrconfig.xml - Этот файл содержит определения и специфичные для ядра конфигурации, связанные с обработкой запросов и форматированием ответов, а также с индексацией, настройкой, управлением памятью и выполнением коммитов.
Schema.xml - Этот файл содержит всю схему вместе с полями и типами полей.
Core.properties- Этот файл содержит конфигурации, специфичные для ядра. Он предназначен дляcore discovery, поскольку он содержит имя ядра и путь к каталогу данных. Его можно использовать в любом каталоге, который затем будет рассматриваться какcore directory.