एलेस्टिक्स खोज - मॉड्यूल
इलास्टिक्स खोज कई मॉड्यूल से बना है, जो इसकी कार्यक्षमता के लिए जिम्मेदार हैं। इन मॉड्यूल में दो प्रकार की सेटिंग्स हैं -
Static Settings- इन सेटिंग्स को Elasticsearch शुरू करने से पहले config (elasticsearch.yml) फ़ाइल में कॉन्फ़िगर करना होगा। आपको इन सेटिंग्स द्वारा परिवर्तनों को प्रतिबिंबित करने के लिए क्लस्टर में सभी चिंता नोड्स को अपडेट करने की आवश्यकता है।
Dynamic Settings - ये सेटिंग्स लाइव एलिटिक्स खोज पर सेट की जा सकती हैं।
हम इस अध्याय के निम्नलिखित खंडों में एलियस्टेकिसर्च के विभिन्न मॉड्यूलों पर चर्चा करेंगे।
क्लस्टर-स्तरीय रूटिंग और शारद आवंटन
क्लस्टर स्तर सेटिंग्स विभिन्न नोड्स के लिए शार्क के आवंटन और शार्क के पुनर्संतलन क्लस्टर के पुनः प्राप्ति का निर्णय लेती हैं। शार्क आवंटन को नियंत्रित करने के लिए ये निम्नलिखित सेटिंग्स हैं।
क्लस्टर-स्तरीय शारद आवंटन
स्थापना | संभव मान | विवरण |
---|---|---|
cluster.routing.allocation.enable | ||
सब | यह डिफ़ॉल्ट मान सभी प्रकार के शार्क के लिए तीव्र आवंटन की अनुमति देता है। | |
प्राइमरी | यह केवल प्राथमिक शार्क के लिए शार्क आवंटन की अनुमति देता है। | |
new_primaries | यह नए सूचकांकों के लिए केवल प्राथमिक शार्क के लिए शार्क आवंटन की अनुमति देता है। | |
कोई नहीं | यह किसी भी शार्क आवंटन की अनुमति नहीं देता है। | |
क्लस्टर .rout.allocation .node_concurrent_recoveries | संख्यात्मक मान (डिफ़ॉल्ट 2 द्वारा) | यह समवर्ती शार्प रिकवरी की संख्या को प्रतिबंधित करता है। |
क्लस्टर .rout.allocation .node_initial_primaries_recoveries | संख्यात्मक मान (डिफ़ॉल्ट रूप से 4) | यह समानांतर प्रारंभिक प्राथमिक पुनर्प्राप्ति की संख्या को प्रतिबंधित करता है। |
क्लस्टर .rout.allocation .same_shard.host | बूलियन मान (डिफ़ॉल्ट रूप से गलत) | यह एक ही भौतिक नोड में एक ही शार्क के एक से अधिक प्रतिकृति के आवंटन को प्रतिबंधित करता है। |
indices.recovery.concurrent _streams | संख्यात्मक मान (डिफ़ॉल्ट 3 द्वारा) | यह पीयर शार्प से शार्प रिकवरी के समय प्रति नोड नेटवर्क ओपन स्ट्रीम की संख्या को नियंत्रित करता है। |
indices.recovery.concurrent _small_file_streams | संख्यात्मक मान (डिफ़ॉल्ट 2 द्वारा) | यह शार्प रिकवरी के समय 5mb से कम साइज वाली छोटी फाइलों के लिए प्रति नोड ओपन स्ट्रीम की संख्या को नियंत्रित करता है। |
cluster.routing.rebalance.enable | ||
सब | यह डिफ़ॉल्ट मान सभी प्रकार की शार्क के लिए संतुलन बनाने की अनुमति देता है। | |
प्राइमरी | यह केवल प्राथमिक शार्क के लिए शार्प संतुलन की अनुमति देता है। | |
प्रतिकृतियां | यह केवल प्रतिकृति शार्क के लिए शार्क को संतुलित करने की अनुमति देता है। | |
कोई नहीं | यह किसी भी प्रकार के शार्प संतुलन की अनुमति नहीं देता है। | |
क्लस्टर .rout.allocation .allow_rebalance | ||
हमेशा | यह डिफ़ॉल्ट मान हमेशा पुन: संतुलन की अनुमति देता है। | |
indices_primaries _ सक्रिय | यह अनुमति देता है जब क्लस्टर में सभी प्राथमिक शार्क आवंटित किए जाते हैं। | |
Indices_all_active | जब सभी प्राथमिक और प्रतिकृति शार्क आवंटित किए जाते हैं तो यह पुनर्संतुलन की अनुमति देता है। | |
क्लस्टर.क्राउट.लोकास्ट.क्लस्टर _concurrent_rebalance | संख्यात्मक मान (डिफ़ॉल्ट 2 द्वारा) | यह क्लस्टर में समवर्ती शार्क संतुलन की संख्या को प्रतिबंधित करता है। |
क्लस्टर .rout.allocation .balance.shard | फ्लोट मान (डिफ़ॉल्ट रूप से 0.45f) | यह प्रत्येक नोड पर आवंटित शार्क के लिए वजन कारक को परिभाषित करता है। |
क्लस्टर .rout.allocation .balance.index | फ्लोट मान (डिफ़ॉल्ट रूप से 0.55f) | यह एक विशिष्ट नोड पर आवंटित प्रति सूचकांक की संख्या के अनुपात को परिभाषित करता है। |
क्लस्टर | गैर नकारात्मक फ्लोट मूल्य (डिफ़ॉल्ट रूप से 1.0f) | यह संचालन का न्यूनतम अनुकूलन मूल्य है जिसे निष्पादित किया जाना चाहिए। |
डिस्क-आधारित शारद आवंटन
स्थापना | संभव मान | विवरण |
---|---|---|
cluster.routing.allocation.disk.threshold_enabled | बूलियन मान (डिफ़ॉल्ट रूप से सत्य) | यह डिस्क आवंटन डिकोडर को सक्षम और निष्क्रिय करता है। |
cluster.routing.allocation.disk.watermark.low | स्ट्रिंग मान (डिफ़ॉल्ट रूप से 85%) | यह डिस्क के अधिकतम उपयोग को दर्शाता है; इस बिंदु के बाद, उस डिस्क पर कोई अन्य शार्क आवंटित नहीं किया जा सकता है। |
cluster.routing.allocation.disk.watermark.high | स्ट्रिंग मान (डिफ़ॉल्ट रूप से 90%) | यह आवंटन के समय अधिकतम उपयोग को दर्शाता है; यदि यह बिंदु आवंटन के समय पर पहुंच जाता है, तो एलिटिक्स खोज उस शार्क को दूसरी डिस्क पर आवंटित करेगी। |
cluster.info.update.interval | स्ट्रिंग मान (डिफ़ॉल्ट रूप से 30 से) | यह डिस्क usages checkups के बीच अंतराल है। |
cluster.routing.allocation.disk.include_relocations | बूलियन मान (डिफ़ॉल्ट रूप से सत्य) | यह तय करता है कि डिस्क उपयोग की गणना करते समय वर्तमान में आवंटित किए जाने वाले शार्क पर विचार करें या नहीं। |
खोज
यह मॉड्यूल क्लस्टर को खोजने और उसमें सभी नोड्स की स्थिति को बनाए रखने में मदद करता है। जब नोड जोड़ा जाता है या उससे हटा दिया जाता है, तो क्लस्टर की स्थिति बदल जाती है। क्लस्टर नाम सेटिंग का उपयोग विभिन्न समूहों के बीच तार्किक अंतर बनाने के लिए किया जाता है। कुछ मॉड्यूल हैं जो आपको क्लाउड विक्रेताओं द्वारा प्रदान किए गए एपीआई का उपयोग करने में मदद करते हैं और जो नीचे दिए गए हैं -
- Azure खोज
- EC2 की खोज
- Google कंप्यूट इंजन की खोज
- झेन खोज
द्वार
यह मॉड्यूल क्लस्टर स्थिति और पूर्ण क्लस्टर पुनरारंभ के दौरान शार्द डेटा बनाए रखता है। इस मॉड्यूल की स्थिर सेटिंग्स निम्नलिखित हैं -
स्थापना | संभव मान | विवरण |
---|---|---|
gateway.expected_nodes | संख्यात्मक मान (डिफ़ॉल्ट 0 से) | स्थानीय शारदों की वसूली के लिए क्लस्टर में नोड्स की संख्या होने की उम्मीद है। |
gateway.expected_master_nodes | संख्यात्मक मान (डिफ़ॉल्ट 0 से) | पुनर्प्राप्ति शुरू करने से पहले मास्टर नोड की संख्या क्लस्टर में होने की उम्मीद है। |
gateway.expected_data_nodes | संख्यात्मक मान (डिफ़ॉल्ट 0 से) | पुनर्प्राप्ति प्रारंभ करने से पहले क्लस्टर में अपेक्षित डेटा नोड्स की संख्या। |
gateway.recover_after_time | स्ट्रिंग मान (डिफ़ॉल्ट रूप से 5 मी) | यह डिस्क usages checkups के बीच अंतराल है। |
cluster.routing.allocation। disk.include_relocations | बूलियन मान (डिफ़ॉल्ट रूप से सत्य) | यह उस समय को निर्दिष्ट करता है जिसके लिए पुनर्प्राप्ति प्रक्रिया क्लस्टर में शामिल नोड्स की संख्या की परवाह किए बिना शुरू करने के लिए इंतजार करेगी। gateway.recover_ after_nodes |
एचटीटीपी
यह मॉड्यूल HTTP क्लाइंट और इलास्टिक्स खोज API के बीच संचार का प्रबंधन करता है। इस मॉड्यूल को http.enabled के गलत मान में बदलकर अक्षम किया जा सकता है।
इस मॉड्यूल को नियंत्रित करने के लिए सेटिंग्स (elasticsearch.yml में कॉन्फ़िगर) हैं -
S.No | सेटिंग और विवरण |
---|---|
1 | http.port यह एलीटेसर्च तक पहुंचने के लिए एक बंदरगाह है और यह 9200-9300 तक है। |
2 | http.publish_port यह पोर्ट http क्लाइंट के लिए है और फ़ायरवॉल के मामले में भी उपयोगी है। |
3 | http.bind_host यह http सेवा के लिए एक मेजबान पता है। |
4 | http.publish_host यह http क्लाइंट के लिए होस्ट एड्रेस है। |
5 | http.max_content_length यह http अनुरोध में सामग्री का अधिकतम आकार है। इसका डिफ़ॉल्ट मान 100mb है। |
6 | http.max_initial_line_length यह URL का अधिकतम आकार है और इसका डिफ़ॉल्ट मान 4kb है। |
7 | http.max_header_size यह अधिकतम http हैडर आकार है और इसका डिफ़ॉल्ट मान 8kb है। |
8 | http.compression यह संपीड़न के लिए समर्थन को सक्षम या अक्षम करता है और इसका डिफ़ॉल्ट मान गलत है। |
9 | http.pipelinig यह HTTP पाइपलाइनिंग को सक्षम या अक्षम करता है। |
10 | http.pipelining.max_events यह HTTP अनुरोध को बंद करने से पहले कतार में होने वाली घटनाओं की संख्या को प्रतिबंधित करता है। |
सूचकांकों
यह मॉड्यूल सेटिंग्स को बनाए रखता है, जो हर इंडेक्स के लिए वैश्विक रूप से सेट होते हैं। निम्नलिखित सेटिंग्स मुख्य रूप से मेमोरी उपयोग से संबंधित हैं -
परिपथ वियोजक
इसका उपयोग OutOfMemroyError के कारण ऑपरेशन को रोकने के लिए किया जाता है। सेटिंग मुख्य रूप से JVM हीप आकार को प्रतिबंधित करती है। उदाहरण के लिए, indices.breaker.total.limit सेटिंग, जो JVM हीप के 70% तक को डिफॉल्ट करता है।
फील्डडेटा कैश
इसका उपयोग मुख्य रूप से एक क्षेत्र पर एकत्रित करते समय किया जाता है। इसे आवंटित करने के लिए पर्याप्त मेमोरी होने की सिफारिश की जाती है। फ़ील्ड डेटा कैश के लिए उपयोग की जाने वाली मेमोरी की मात्रा को indices.fielddata.cache.size सेटिंग का उपयोग करके नियंत्रित किया जा सकता है।
नोड क्वेरी कैश
इस मेमोरी का उपयोग क्वेरी परिणामों को कैशिंग करने के लिए किया जाता है। यह कैश कम से कम हाल ही में उपयोग की गई (LRU) बेदखली नीति का उपयोग करता है। Indices.queries.cahce.size सेटिंग इस कैश की मेमोरी साइज़ को नियंत्रित करती है।
अनुक्रमण बफ़र
यह बफ़र नए बनाए गए दस्तावेज़ों को अनुक्रमणिका में संग्रहीत करता है और बफ़र पूर्ण होने पर उन्हें फ़्लश करता है। Indices.memory.index_buffer_size जैसी सेटिंग इस बफर के लिए आवंटित ढेर की मात्रा को नियंत्रित करती है।
शारद अनुरोध कैश
इस कैश का उपयोग प्रत्येक शार्क के लिए स्थानीय खोज डेटा को संग्रहीत करने के लिए किया जाता है। अनुक्रमणिका के निर्माण के दौरान कैश को सक्षम किया जा सकता है या URL पैरामीटर भेजकर अक्षम किया जा सकता है।
Disable cache - ?request_cache = true
Enable cache "index.requests.cache.enable": true
संकेत रिकवरी
यह पुनर्प्राप्ति प्रक्रिया के दौरान संसाधनों को नियंत्रित करता है। निम्नलिखित सेटिंग्स हैं -
स्थापना | डिफ़ॉल्ट मान |
---|---|
indices.recovery.concurrent_streams | 3 |
indices.recovery.concurrent_small_file_streams | 2 |
indices.recovery.file_chunk_size | 512KB |
indices.recovery.translog_ops | 1000 |
indices.recovery.translog_size | 512KB |
indices.recovery.compress | सच |
indices.recovery.max_bytes_per_sec | 40mb |
टीटीएल अंतराल
लाइव टू टाइम (टीटीएल) अंतराल एक दस्तावेज के समय को परिभाषित करता है, जिसके बाद दस्तावेज़ हटा दिया जाता है। इस प्रक्रिया को नियंत्रित करने के लिए गतिशील सेटिंग्स निम्नलिखित हैं -
स्थापना | डिफ़ॉल्ट मान |
---|---|
indices.ttl.interval | 60 के दशक |
indices.ttl.bulk_size | 1000 |
नोड
प्रत्येक नोड में डेटा नोड या नहीं होने का विकल्प होता है। आप इस संपत्ति को बदलकर बदल सकते हैंnode.dataस्थापना। मान को सेट करनाfalse परिभाषित करता है कि नोड डेटा नोड नहीं है।