Apache Solr - Thuật ngữ
Trong chương này, chúng tôi sẽ cố gắng hiểu ý nghĩa thực sự của một số thuật ngữ thường được sử dụng khi làm việc trên Solr.
Thuật ngữ chung
Sau đây là danh sách các thuật ngữ chung được sử dụng cho tất cả các loại thiết lập Solr:
Instance - Giống như một tomcat instance hoặc một jetty instance, thuật ngữ này đề cập đến máy chủ ứng dụng, chạy bên trong JVM. Thư mục chính của Solr cung cấp tham chiếu đến từng cá thể Solr này, trong đó một hoặc nhiều lõi có thể được cấu hình để chạy trong từng cá thể.
Core - Trong khi chạy nhiều chỉ mục trong ứng dụng của bạn, bạn có thể có nhiều lõi trong mỗi phiên bản, thay vì nhiều phiên bản mỗi phiên bản có một lõi.
Home - Thuật ngữ $ SOLR_HOME dùng để chỉ thư mục chính có tất cả thông tin liên quan đến các lõi và chỉ mục, cấu hình và phụ thuộc của chúng.
Shard - Trong môi trường phân tán, dữ liệu được phân vùng giữa nhiều cá thể Solr, trong đó mỗi phần dữ liệu có thể được gọi là Shard. Nó chứa một tập hợp con của toàn bộ chỉ mục.
Thuật ngữ SolrCloud
Trong chương trước, chúng ta đã thảo luận về cách cài đặt Apache Solr ở chế độ độc lập. Lưu ý rằng chúng ta cũng có thể cài đặt Solr ở chế độ phân tán (môi trường đám mây) trong đó Solr được cài đặt theo mô hình chủ-tớ. Trong chế độ phân tán, chỉ mục được tạo trên máy chủ chính và nó được sao chép sang một hoặc nhiều máy chủ phụ.
Các thuật ngữ chính liên quan đến Solr Cloud như sau:
Node - Trong đám mây Solr, mỗi phiên bản Solr được coi là một node.
Cluster - Tất cả các nút của môi trường kết hợp với nhau tạo thành một cluster.
Collection - Một cụm có một chỉ mục logic được gọi là collection.
Shard - Phân đoạn là một phần của tập hợp có một hoặc nhiều bản sao của chỉ mục.
Replica - Trong Solr Core, một bản sao của phân đoạn chạy trong một nút được gọi là replica.
Leader - Nó cũng là một bản sao của phân đoạn, phân phối các yêu cầu của Solr Cloud đến các bản sao còn lại.
Zookeeper - Đây là một dự án Apache mà Solr Cloud sử dụng để cấu hình và điều phối tập trung, để quản lý cụm và bầu ra người lãnh đạo.
Tệp cấu hình
Các tệp cấu hình chính trong Apache Solr như sau:
Solr.xml- Đây là tệp trong thư mục $ SOLR_HOME chứa thông tin liên quan đến Solr Cloud. Để tải các lõi, Solr đề cập đến tệp này, giúp xác định chúng.
Solrconfig.xml - Tệp này chứa các định nghĩa và cấu hình cốt lõi cụ thể liên quan đến việc xử lý yêu cầu và định dạng phản hồi, cùng với lập chỉ mục, cấu hình, quản lý bộ nhớ và thực hiện các cam kết.
Schema.xml - Tệp này chứa toàn bộ lược đồ cùng với các trường và kiểu trường.
Core.properties- Tệp này chứa các cấu hình dành riêng cho lõi. Nó được giới thiệu chocore discovery, vì nó chứa tên của lõi và đường dẫn của thư mục dữ liệu. Nó có thể được sử dụng trong bất kỳ thư mục nào, sau đó sẽ được coi làcore directory.