Apache Solr - Terminologia
Neste capítulo, tentaremos entender o significado real de alguns dos termos que são freqüentemente usados ao trabalhar no Solr.
Terminologia Geral
A seguir está uma lista de termos gerais que são usados em todos os tipos de configurações Solr -
Instance - Como um tomcat instance ou um jetty instance, este termo se refere ao servidor de aplicativos, que é executado dentro de uma JVM. O diretório inicial do Solr fornece referência a cada uma dessas instâncias do Solr, nas quais um ou mais núcleos podem ser configurados para execução em cada instância.
Core - Ao executar vários índices em seu aplicativo, você pode ter vários núcleos em cada instância, em vez de várias instâncias, cada uma com um núcleo.
Home - O termo $ SOLR_HOME se refere ao diretório inicial que contém todas as informações sobre os núcleos e seus índices, configurações e dependências.
Shard - Em ambientes distribuídos, os dados são particionados entre várias instâncias do Solr, onde cada bloco de dados pode ser chamado de Shard. Ele contém um subconjunto de todo o índice.
Terminologia SolrCloud
Em um capítulo anterior, discutimos como instalar o Apache Solr no modo autônomo. Observe que também podemos instalar o Solr no modo distribuído (ambiente de nuvem), onde o Solr é instalado em um padrão mestre-escravo. No modo distribuído, o índice é criado no servidor mestre e replicado para um ou mais servidores escravos.
Os principais termos associados ao Solr Cloud são os seguintes -
Node - Na nuvem Solr, cada instância única do Solr é considerada como um node.
Cluster - Todos os nós do ambiente combinados formam um cluster.
Collection - Um cluster tem um índice lógico conhecido como collection.
Shard - Um fragmento é a parte da coleção que possui uma ou mais réplicas do índice.
Replica - No Solr Core, uma cópia do fragmento que é executado em um nó é conhecido como replica.
Leader - Também é uma réplica do shard, que distribui as solicitações do Solr Cloud para as réplicas restantes.
Zookeeper - É um projeto Apache que Solr Cloud usa para configuração e coordenação centralizadas, para gerenciar o cluster e eleger um líder.
Arquivos de configuração
Os principais arquivos de configuração no Apache Solr são os seguintes -
Solr.xml- É o arquivo no diretório $ SOLR_HOME que contém informações relacionadas ao Solr Cloud. Para carregar os núcleos, o Solr se refere a este arquivo, que ajuda a identificá-los.
Solrconfig.xml - Este arquivo contém as definições e configurações específicas do núcleo relacionadas ao tratamento da solicitação e formatação da resposta, junto com a indexação, configuração, gerenciamento de memória e confirmação.
Schema.xml - Este arquivo contém todo o esquema junto com os campos e tipos de campo.
Core.properties- Este arquivo contém as configurações específicas do núcleo. É referido paracore discovery, pois contém o nome do núcleo e o caminho do diretório de dados. Ele pode ser usado em qualquer diretório, que será então tratado como ocore directory.