Apache Solr - Terminologia
Neste capítulo, tentaremos entender o significado real de alguns dos termos que são freqüentemente usados ao trabalhar no Solr.
Terminologia Geral
A seguir está uma lista de termos gerais que são usados em todos os tipos de configurações Solr -
- Instance - Como um tomcat instance ou um jetty instance, este termo se refere ao servidor de aplicativos, que é executado dentro de uma JVM. O diretório inicial do Solr fornece referência a cada uma dessas instâncias do Solr, nas quais um ou mais núcleos podem ser configurados para execução em cada instância. 
- Core - Ao executar vários índices em seu aplicativo, você pode ter vários núcleos em cada instância, em vez de várias instâncias, cada uma com um núcleo. 
- Home - O termo $ SOLR_HOME se refere ao diretório inicial que contém todas as informações sobre os núcleos e seus índices, configurações e dependências. 
- Shard - Em ambientes distribuídos, os dados são particionados entre várias instâncias do Solr, onde cada bloco de dados pode ser chamado de Shard. Ele contém um subconjunto de todo o índice. 
Terminologia SolrCloud
Em um capítulo anterior, discutimos como instalar o Apache Solr no modo autônomo. Observe que também podemos instalar o Solr no modo distribuído (ambiente de nuvem), onde o Solr é instalado em um padrão mestre-escravo. No modo distribuído, o índice é criado no servidor mestre e replicado para um ou mais servidores escravos.
Os principais termos associados ao Solr Cloud são os seguintes -
- Node - Na nuvem Solr, cada instância única do Solr é considerada como um node. 
- Cluster - Todos os nós do ambiente combinados formam um cluster. 
- Collection - Um cluster tem um índice lógico conhecido como collection. 
- Shard - Um fragmento é a parte da coleção que possui uma ou mais réplicas do índice. 
- Replica - No Solr Core, uma cópia do fragmento que é executado em um nó é conhecido como replica. 
- Leader - Também é uma réplica do shard, que distribui as solicitações do Solr Cloud para as réplicas restantes. 
- Zookeeper - É um projeto Apache que Solr Cloud usa para configuração e coordenação centralizadas, para gerenciar o cluster e eleger um líder. 
Arquivos de configuração
Os principais arquivos de configuração no Apache Solr são os seguintes -
- Solr.xml- É o arquivo no diretório $ SOLR_HOME que contém informações relacionadas ao Solr Cloud. Para carregar os núcleos, o Solr se refere a este arquivo, que ajuda a identificá-los. 
- Solrconfig.xml - Este arquivo contém as definições e configurações específicas do núcleo relacionadas ao tratamento da solicitação e formatação da resposta, junto com a indexação, configuração, gerenciamento de memória e confirmação. 
- Schema.xml - Este arquivo contém todo o esquema junto com os campos e tipos de campo. 
- Core.properties- Este arquivo contém as configurações específicas do núcleo. É referido paracore discovery, pois contém o nome do núcleo e o caminho do diretório de dados. Ele pode ser usado em qualquer diretório, que será então tratado como ocore directory.