एलेस्टिक्स खोज - त्वरित गाइड

एलीस्टेकचर्च एक अपाचे ल्यूसीन आधारित खोज सर्वर है। इसे Shay Banon द्वारा विकसित किया गया था और 2010 में प्रकाशित किया गया था। अब इसे Elasticsearch BV द्वारा बनाए रखा गया है। इसका नवीनतम संस्करण 7.0.0 है।

एलीस्टेकर्च एक वास्तविक समय पर वितरित और खुला स्रोत पूर्ण-पाठ खोज और एनालिटिक्स इंजन है। यह Restful वेब सेवा इंटरफ़ेस से सुलभ है और डेटा स्टोर करने के लिए स्कीमा कम JSON (जावास्क्रिप्ट ऑब्जेक्ट नोटेशन) दस्तावेजों का उपयोग करता है। यह जावा प्रोग्रामिंग लैंग्वेज पर बनाया गया है और इसलिए एलिटिक्सर्च विभिन्न प्लेटफार्मों पर चल सकता है। यह उपयोगकर्ताओं को बहुत अधिक गति से बहुत बड़ी मात्रा में डेटा का पता लगाने में सक्षम बनाता है।

सामान्य विशेषताएं

इलास्टिक्स की सामान्य विशेषताएं इस प्रकार हैं -

  • इलास्टिक्स खोज संरचित और असंरचित डेटा के पेटाबाइट्स तक स्केलेबल है।

  • इलास्टिक्स खोज का उपयोग मोंगोबीडी और रेवेनडीबी जैसे दस्तावेज़ स्टोरों के प्रतिस्थापन के रूप में किया जा सकता है।

  • खोज प्रदर्शन में सुधार करने के लिए एलियटसर्च खोज का उपयोग करता है।

  • एलिटिक्स खोज लोकप्रिय उद्यम खोज इंजनों में से एक है, और वर्तमान में इसका उपयोग विकिपीडिया, द गार्जियन, स्टैकऑवरफ़्लो, गिटहब आदि जैसे कई बड़े संगठनों द्वारा किया जा रहा है।

  • इलास्टिसर्च एक खुला स्रोत है और अपाचे लाइसेंस संस्करण 2.0 के तहत उपलब्ध है।

प्रमुख धारणाएँ

एलियस्टिक्स खोज की प्रमुख अवधारणाएँ इस प्रकार हैं -

नोड

यह एलिस्टिक्स खोज के एकल चल रहे उदाहरण को संदर्भित करता है। सिंगल फिजिकल और वर्चुअल सर्वर रैम, स्टोरेज और प्रोसेसिंग पावर जैसे उनके भौतिक संसाधनों की क्षमताओं के आधार पर कई नोड्स को समायोजित करता है।

समूह

यह एक या एक से अधिक नोड्स का संग्रह है। क्लस्टर संपूर्ण डेटा के लिए सभी नोड्स में सामूहिक अनुक्रमण और खोज क्षमताएं प्रदान करता है।

सूची

यह विभिन्न प्रकार के दस्तावेजों और उनके गुणों का एक संग्रह है। सूचकांक प्रदर्शन में सुधार के लिए शार्क की अवधारणा का भी उपयोग करता है। उदाहरण के लिए, दस्तावेज़ के एक सेट में एक सामाजिक नेटवर्किंग एप्लिकेशन का डेटा होता है।

डाक्यूमेंट

यह JSON प्रारूप में परिभाषित विशिष्ट तरीके से फ़ील्ड का संग्रह है। प्रत्येक दस्तावेज़ एक प्रकार का होता है और एक इंडेक्स के अंदर रहता है। प्रत्येक दस्तावेज़ यूआईडी नामक एक विशिष्ट पहचानकर्ता के साथ जुड़ा हुआ है।

ठीकरा

सूचकांक क्षैतिज रूप से शार्क में उप-विभाजित होते हैं। इसका अर्थ है कि प्रत्येक शार्प में दस्तावेज़ के सभी गुण शामिल हैं, लेकिन इंडेक्स की तुलना में JSON ऑब्जेक्ट्स की संख्या कम है। क्षैतिज पृथक्करण शार्प को एक स्वतंत्र नोड बनाता है, जिसे किसी भी नोड में स्टोर किया जा सकता है। प्राथमिक शार्ड एक इंडेक्स का मूल क्षैतिज भाग होता है और फिर इन प्राथमिक शार्प्स को प्रतिकृति शार्प्स में दोहराया जाता है।

प्रतिकृतियां

एलेस्टिक्स खोज एक उपयोगकर्ता को अपने अनुक्रमित और शार्क के प्रतिकृतियां बनाने की अनुमति देता है। प्रतिकृति न केवल विफलता के मामले में डेटा की उपलब्धता को बढ़ाने में मदद करती है, बल्कि इन प्रतिकृतियों में एक समानांतर खोज ऑपरेशन करके खोज के प्रदर्शन में सुधार करती है।

लाभ

  • Elasticsearch जावा पर विकसित किया गया है, जो इसे लगभग हर मंच पर संगत बनाता है।

  • एलियटिक्सखोज वास्तविक समय है, दूसरे शब्दों में एक के बाद एक जोड़ा दस्तावेज़ इस इंजन में खोजा जा सकता है

  • इलास्टिसर्च वितरित किया जाता है, जो किसी भी बड़े संगठन को स्केल और एकीकृत करना आसान बनाता है।

  • गेटवे की अवधारणा का उपयोग करके पूर्ण बैकअप बनाना आसान है, जो कि इलास्टिसर्च में मौजूद है।

  • Apache Solr की तुलना में Elasticsearch में मल्टी-टेनेंसी को हैंडल करना बहुत आसान है।

  • इलास्टिक्स खोज JSON ऑब्जेक्ट्स को प्रतिक्रियाओं के रूप में उपयोग करती है, जो कि बड़ी संख्या में विभिन्न प्रोग्रामिंग भाषाओं के साथ एलिस्टिक्स खोज सर्वर को लागू करना संभव बनाता है।

  • एलिटिक्स खोज पाठ के प्रतिपादन का समर्थन नहीं करने वालों को छोड़कर लगभग हर दस्तावेज़ प्रकार का समर्थन करती है।

नुकसान

  • इलास्टिसर्च में अपाचे सोलर के विपरीत अनुरोध और प्रतिक्रिया डेटा (केवल JSON में संभव) के संदर्भ में बहु-भाषा समर्थन नहीं है, जहां यह CSV, XML और JSON प्रारूपों में संभव है।

  • कभी-कभी, एलियस्टिक्स खोज में विभाजित मस्तिष्क स्थितियों की समस्या होती है।

एलिस्टिक्स खोज और आरडीबीएमएस के बीच तुलना

इलास्टिक्स खोज में, सूचकांक RDBMS (संबंध डेटाबेस प्रबंधन प्रणाली) में तालिकाओं के समान है। हर तालिका पंक्तियों का एक संग्रह है, जैसा कि हर सूचकांक इलास्टिक्स में दस्तावेजों का संग्रह है।

निम्न तालिका इन पदों के बीच एक सीधी तुलना देती है

Elasticsearch आरडीबीएमएस
समूह डेटाबेस
ठीकरा ठीकरा
सूची टेबल
मैदान स्तंभ
डाक्यूमेंट पंक्ति

इस अध्याय में, हम विस्तार से एलिस्टिक्स की स्थापना प्रक्रिया को समझेंगे।

अपने स्थानीय कंप्यूटर पर एलेस्टिक्स को स्थापित करने के लिए, आपको नीचे दिए गए चरणों का पालन करना होगा -

Step 1- अपने कंप्यूटर पर स्थापित जावा के संस्करण की जाँच करें। यह जावा 7 या उच्चतर होना चाहिए। आप निम्न कार्य करके देख सकते हैं -

विंडोज ऑपरेटिंग सिस्टम (OS) में (कमांड प्रॉम्प्ट का उपयोग करके) -

> java -version

UNIX OS में (टर्मिनल का उपयोग करके) -

$ echo $JAVA_HOME

Step 2 - आपके ऑपरेटिंग सिस्टम पर निर्भर करते हुए, नीचे दिए गए तरीके से www.elastic.co से एलेस्टिक्स को डाउनलोड करें -

  • विंडोज़ ओएस के लिए, ज़िप फ़ाइल डाउनलोड करें।

  • UNIX OS के लिए, TAR फ़ाइल डाउनलोड करें।

  • डेबियन ओएस के लिए, डीईबी फ़ाइल डाउनलोड करें।

  • Red Hat और अन्य लिनक्स वितरणों के लिए, RPN फ़ाइल डाउनलोड करें।

  • APT और यम उपयोगिताओं का उपयोग कई लिनक्स वितरणों में Elasticsearch स्थापित करने के लिए भी किया जा सकता है।

Step 3 - एलीस्टेक खोज के लिए इंस्टॉलेशन प्रक्रिया सरल है और विभिन्न ओएस के लिए नीचे वर्णित है -

  • Windows OS- ज़िप पैकेज खोलना और इलास्टिक्स खोज स्थापित किया गया है।

  • UNIX OS- किसी भी स्थान पर टार फाइल निकालें और एलिटिक्स खोज स्थापित की गई है।

$wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch7.0.0-linux-x86_64.tar.gz $tar -xzf elasticsearch-7.0.0-linux-x86_64.tar.gz
  • Using APT utility for Linux OS- सार्वजनिक हस्ताक्षर कुंजी डाउनलोड और स्थापित करें

$ wget -qo - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo
apt-key add -

नीचे दिखाए अनुसार रिपॉजिटरी परिभाषा को सहेजें -

$ echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" |
sudo tee -a /etc/apt/sources.list.d/elastic-7.x.list

निम्नलिखित कमांड का उपयोग करके अपडेट चलाएं -

$ sudo apt-get update

अब आप निम्न कमांड का उपयोग करके स्थापित कर सकते हैं -

$ sudo apt-get install elasticsearch
  • Download and install the Debian package manually using the command given here −

$wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch7.0.0-amd64.deb $sudo dpkg -i elasticsearch-7.0.0-amd64.deb0
  • Using YUM utility for Debian Linux OS

  • डाउनलोड करें और सार्वजनिक हस्ताक्षर कुंजी स्थापित करें -

$ rpm --import https://artifacts.elastic.co/GPG-KEY-elasticsearch
  • अपने "/etc/yum.repos.d/" निर्देशिका में .repo प्रत्यय के साथ फ़ाइल में निम्न पाठ जोड़ें। उदाहरण के लिए, elasticsearch.repo

elasticsearch-7.x]
name=Elasticsearch repository for 7.x packages
baseurl=https://artifacts.elastic.co/packages/7.x/yum
gpgcheck=1
gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch
enabled=1
autorefresh=1
type=rpm-md
  • अब आप निम्न आदेश का उपयोग करके एलिस्टिक्स खोज स्थापित कर सकते हैं

sudo yum install elasticsearch

Step 4- एलिटिक्सर्च होम डायरेक्टरी और बिन फोल्डर के अंदर जाएं। विंडोज के मामले में elasticsearch.bat फ़ाइल को चलाएं या आप UNIX रम Elasticsearch फ़ाइल के मामले में कमांड प्रॉम्प्ट और टर्मिनल के माध्यम से भी ऐसा ही कर सकते हैं।

विंडोज में

> cd elasticsearch-2.1.0/bin
> elasticsearch

लिनक्स में

$ cd elasticsearch-2.1.0/bin
$ ./elasticsearch

Note - खिड़कियों के मामले में, आपको एक त्रुटि मिल सकती है जिसमें कहा गया है कि JAVA_HOME सेट नहीं है, कृपया इसे पर्यावरण चर में "C: \ Program Files \ Java \ jre1.8.0_31" या उस स्थान पर सेट करें जहाँ आपने जावा स्थापित किया है।

Step 5- Elasticsearch वेब इंटरफेस के लिए डिफ़ॉल्ट पोर्ट 9200 है या आप इसे बिन निर्देशिका में मौजूद elasticsearch.yml फ़ाइल के अंदर http.port बदलकर बदल सकते हैं। आप देख सकते हैं कि सर्वर ब्राउज़ करके चल रहा है या नहींhttp://localhost:9200। यह एक JSON ऑब्जेक्ट लौटाएगा, जिसमें निम्न तरीके से स्थापित Elasticsearch की जानकारी है -

{
   "name" : "Brain-Child",
   "cluster_name" : "elasticsearch", "version" : {
      "number" : "2.1.0",
      "build_hash" : "72cd1f1a3eee09505e036106146dc1949dc5dc87",
      "build_timestamp" : "2015-11-18T22:40:03Z",
      "build_snapshot" : false,
      "lucene_version" : "5.3.1"
   },
   "tagline" : "You Know, for Search"
}

Step 6- इस स्टेप में, हम किबाना इंस्टॉल करते हैं। लिनक्स और विंडोज पर स्थापित करने के लिए नीचे दिए गए संबंधित कोड का पालन करें -

For Installation on Linux −

wget https://artifacts.elastic.co/downloads/kibana/kibana-7.0.0-linuxx86_64.tar.gz

tar -xzf kibana-7.0.0-linux-x86_64.tar.gz

cd kibana-7.0.0-linux-x86_64/

./bin/kibana

For Installation on Windows −

Windows से Kibana डाउनलोड करें https://www.elastic.co/products/kibana. एक बार जब आप लिंक पर क्लिक करते हैं, तो आपको नीचे दिखाए अनुसार होम पेज मिलेगा -

अनज़िप करें और किबाना होम डायरेक्टरी में जाएं और फिर इसे रन करें।

CD c:\kibana-7.0.0-windows-x86_64
.\bin\kibana.bat

इस अध्याय में, आइए जानें कि कैसे कुछ इंडेक्स, मैपिंग और डेटा को एलियस्टिक्स खोज में जोड़ा जाए। ध्यान दें कि इस ट्यूटोरियल में बताए गए उदाहरणों में कुछ डेटा का उपयोग किया जाएगा।

सूचकांक बनाएँ

एक इंडेक्स बनाने के लिए आप निम्न कमांड का उपयोग कर सकते हैं -

PUT school

प्रतिक्रिया

यदि सूचकांक बनाया जाता है, तो आप निम्न आउटपुट देख सकते हैं -

{"acknowledged": true}

डेटा जोड़ें

निम्न सूची में दिखाए गए अनुसार, हम जो सूची में जोड़ते हैं, उसके लिए एलियस्टैकेस खोजा जाएगा। दस्तावेजों को कुछ आईडी दिए गए हैं जिनका उपयोग दस्तावेज़ की पहचान करने में किया जाता है।

शरीर का अनुरोध करें

POST school/_doc/10
{
   "name":"Saint Paul School", "description":"ICSE Afiliation",
   "street":"Dawarka", "city":"Delhi", "state":"Delhi", "zip":"110075",
   "location":[28.5733056, 77.0122136], "fees":5000,
   "tags":["Good Faculty", "Great Sports"], "rating":"4.5"
}

प्रतिक्रिया

{
   "_index" : "school",
   "_type" : "_doc",
   "_id" : "10",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 2,
   "_primary_term" : 1
}

यहां, हम एक और समान दस्तावेज़ जोड़ रहे हैं।

POST school/_doc/16
{
   "name":"Crescent School", "description":"State Board Affiliation",
   "street":"Tonk Road",
   "city":"Jaipur", "state":"RJ", "zip":"176114","location":[26.8535922,75.7923988],
   "fees":2500, "tags":["Well equipped labs"], "rating":"4.5"
}

प्रतिक्रिया

{
   "_index" : "school",
   "_type" : "_doc",
   "_id" : "16",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 9,
   "_primary_term" : 7
}

इस तरह, हम आगामी चैप्टर में अपने काम के लिए आवश्यक किसी भी उदाहरण डेटा को जोड़ते रहेंगे।

किबाना में सैंपल डेटा जोड़ना

डेटा को एक्सेस करने और विज़ुअलाइज़ेशन बनाने के लिए Kibana एक GUI संचालित टूल है। इस खंड में, हम समझते हैं कि हम इसमें नमूना डेटा कैसे जोड़ सकते हैं।

किबाना होम पेज में, नमूना ई-कॉमर्स डेटा जोड़ने के लिए निम्नलिखित विकल्प चुनें -

अगली स्क्रीन कुछ दृश्य और डेटा जोड़ने के लिए एक बटन दिखाएगी -

Add Data पर क्लिक करने पर निम्न स्क्रीन दिखाई देगी जो यह पुष्टि करती है कि डेटा को eCommerce नाम के एक इंडेक्स में जोड़ा गया है।

किसी भी सिस्टम या सॉफ्टवेयर में, जब हम नए संस्करण में अपग्रेड करते हैं, तो हमें एप्लिकेशन सेटिंग्स, कॉन्फ़िगरेशन, डेटा और अन्य चीजों को बनाए रखने के लिए कुछ चरणों का पालन करना होगा। नई प्रणाली में एप्लिकेशन को स्थिर बनाने या डेटा की अखंडता बनाए रखने के लिए इन कदमों की आवश्यकता होती है (डेटा को दूषित होने से रोकें)।

एलिस्टिक्स खोज को उन्नत करने के लिए आपको निम्नलिखित चरणों का पालन करना होगा -

  • से डॉक्स अपग्रेड पढ़ें https://www.elastic.co/

  • UAT, E2E, SIT या DEV वातावरण जैसे अपने गैर-उत्पादन वातावरण में उन्नत संस्करण का परीक्षण करें।

  • ध्यान दें कि डेटा बैकअप के बिना पिछले इलास्टिक्स खोज संस्करण में रोलबैक संभव नहीं है। इसलिए, उच्च संस्करण में अपग्रेड करने से पहले डेटा बैकअप की सिफारिश की जाती है।

  • हम पूर्ण क्लस्टर रीस्टार्ट या रोलिंग अपग्रेड का उपयोग करके अपग्रेड कर सकते हैं। रोलिंग अपग्रेड नए संस्करणों के लिए है। ध्यान दें कि कोई सेवा आउटेज नहीं है, जब आप माइग्रेशन के लिए रोलिंग अपग्रेड विधि का उपयोग कर रहे हैं।

उन्नयन के लिए कदम

  • अपने उत्पादन क्लस्टर को अपग्रेड करने से पहले एक देव वातावरण में उन्नयन का परीक्षण करें।

  • अपने डेटा का बैकअप लें। जब तक आपके पास अपने डेटा का स्नैपशॉट नहीं है, आप किसी पुराने संस्करण पर वापस नहीं लौट सकते।

  • अपग्रेड प्रक्रिया शुरू करने से पहले मशीन सीखने की नौकरियों पर विचार करें। जबकि मशीन सीखने की नौकरियां रोलिंग अपग्रेड के दौरान चलती रह सकती हैं, यह अपग्रेड प्रक्रिया के दौरान क्लस्टर पर ओवरहेड को बढ़ाता है।

  • निम्नलिखित क्रम में अपने इलास्टिक स्टैक के घटकों को अपग्रेड करें -

    • Elasticsearch
    • Kibana
    • Logstash
    • Beats
    • एपीएम सर्वर

6.6 या इससे पहले के उन्नयन

संस्करण 6.0-6.6 से एलिटिक्स खोज 7.1.0 में सीधे अपग्रेड करने के लिए, आपको मैन्युअल रूप से किसी भी 5.x सूचकांक को फिर से लिखना होगा जिसे आपको आगे ले जाने की आवश्यकता है, और एक पूर्ण क्लस्टर पुनरारंभ करें।

पूर्ण क्लस्टर पुनरारंभ

पूर्ण क्लस्टर पुनरारंभ की प्रक्रिया में क्लस्टर में प्रत्येक नोड को बंद करना, प्रत्येक नोड को 7x में अपग्रेड करना और फिर क्लस्टर को पुनरारंभ करना शामिल है।

निम्नलिखित उच्च स्तरीय चरण हैं जिन्हें पूर्ण क्लस्टर पुनः आरंभ करने के लिए किए जाने की आवश्यकता है -

  • शार्क आवंटन अक्षम करें
  • अनुक्रमित करना बंद करें और एक सिंक किए गए फ्लश का प्रदर्शन करें
  • शटडाउन सभी नोड्स
  • सभी नोड्स को अपग्रेड करें
  • किसी भी प्लगइन्स को अपग्रेड करें
  • प्रत्येक उन्नत नोड को प्रारंभ करें
  • क्लस्टर में शामिल होने के लिए सभी नोड्स की प्रतीक्षा करें और पीले रंग की स्थिति की रिपोर्ट करें
  • आवंटन को पुनः सक्षम करें

आवंटन को पुन: सक्षम करने के बाद, क्लस्टर डेटा नोड्स में प्रतिकृति शार्क को आवंटित करना शुरू करता है। इस बिंदु पर, अनुक्रमण और खोज को फिर से शुरू करना सुरक्षित है, लेकिन आपका क्लस्टर अधिक तेज़ी से पुनर्प्राप्त करेगा यदि आप प्रतीक्षा कर सकते हैं जब तक कि सभी प्राथमिक और प्रतिकृति शार्क को सफलतापूर्वक आवंटित नहीं किया गया हो और सभी नोड्स की स्थिति हरे रंग की हो।

वेब में एप्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआई) उस विशेष वेब एप्लिकेशन में सॉफ्टवेयर घटक तक पहुंचने के लिए फ़ंक्शन कॉल या अन्य प्रोग्रामिंग निर्देशों का एक समूह है। उदाहरण के लिए, फेसबुक एपीआई एक डेवलपर को फेसबुक से डेटा या अन्य कार्यात्मकताओं तक पहुंच बनाने में मदद करता है; यह जन्म की तारीख या स्थिति अद्यतन हो सकता है।

इलास्टिक्सखोज एक REST API प्रदान करता है, जिसे JSON द्वारा HTTP पर एक्सेस किया जाता है। एलियटसर्च कुछ सम्मेलनों का उपयोग करता है, जिन पर हम अब चर्चा करेंगे।

एकाधिक संकेत

एपीआई में ज्यादातर ऑपरेशन, मुख्य रूप से खोज और अन्य ऑपरेशन, एक या एक से अधिक सूचकांकों के लिए होते हैं। यह केवल एक बार किसी क्वेरी को निष्पादित करके उपयोगकर्ता को कई स्थानों या सभी उपलब्ध डेटा को खोजने में मदद करता है। कई सूचकांकों में संचालन करने के लिए कई अलग-अलग नोटेशन का उपयोग किया जाता है। हम उनमें से कुछ पर इस अध्याय में चर्चा करेंगे।

कॉमा सेपरेटेड नोटेशन

POST /index1,index2,index3/_search

शरीर का अनुरोध करें

{
   "query":{
      "query_string":{
         "query":"any_string"
      }
   }
}

प्रतिक्रिया

इंडेक्स 1, इंडेक्स 2, इंडेक्स 3 से JSON ऑब्जेक्ट्स में कोई भी_स्ट्रिंग है।

सभी इंद्रियों के लिए _ कीवर्ड

POST /_all/_search

शरीर का अनुरोध करें

{
   "query":{
      "query_string":{
         "query":"any_string"
      }
   }
}

प्रतिक्रिया

JSON ऑब्जेक्ट्स को सभी सूचकांकों से और इसमें किसी भी_स्ट्रिंग के होने से।

वाइल्डकार्ड्स (*, +, -)

POST /school*/_search

शरीर का अनुरोध करें

{
   "query":{
      "query_string":{
         "query":"CBSE"
      }
   }
}

प्रतिक्रिया

JSON ऑब्जेक्ट्स सभी सूचकांकों से शुरू होते हैं जो स्कूल में होते हैं जिसमें CBSE होता है।

वैकल्पिक रूप से, आप निम्नलिखित कोड का उपयोग कर सकते हैं -

POST /school*,-schools_gov /_search

शरीर का अनुरोध करें

{
   "query":{
      "query_string":{
         "query":"CBSE"
      }
   }
}

प्रतिक्रिया

JSON ऑब्जेक्ट सभी सूचकांकों से शुरू होता है, जो "स्कूल" से शुरू होते हैं, लेकिन स्कूल_ओजी से नहीं और इसमें सीबीएसई होते हैं।

कुछ URL क्वेरी स्ट्रिंग पैरामीटर भी हैं -

  • ignore_unavailable- कोई त्रुटि नहीं होगी या कोई ऑपरेशन बंद नहीं किया जाएगा, अगर URL में मौजूद एक या एक से अधिक इंडेक्स मौजूद नहीं हैं। उदाहरण के लिए, स्कूलों के सूचकांक मौजूद हैं, लेकिन बुक_ कार्यशालाएं मौजूद नहीं हैं।

POST /school*,book_shops/_search

शरीर का अनुरोध करें

{
   "query":{
      "query_string":{
         "query":"CBSE"
      }
   }
}

शरीर का अनुरोध करें

{
   "error":{
      "root_cause":[{
         "type":"index_not_found_exception", "reason":"no such index",
         "resource.type":"index_or_alias", "resource.id":"book_shops",
         "index":"book_shops"
      }],
      "type":"index_not_found_exception", "reason":"no such index",
      "resource.type":"index_or_alias", "resource.id":"book_shops",
      "index":"book_shops"
   },"status":404
}

निम्नलिखित कोड पर विचार करें -

POST /school*,book_shops/_search?ignore_unavailable = true

शरीर का अनुरोध करें

{
   "query":{
      "query_string":{
         "query":"CBSE"
      }
   }
}

प्रतिक्रिया (कोई त्रुटि नहीं)

JSON ऑब्जेक्ट्स सभी सूचकांकों से शुरू होते हैं जो स्कूल में होते हैं जिसमें CBSE होता है।

allow_no_indices

trueइस पैरामीटर के मूल्य में त्रुटि को रोका जा सकेगा, अगर वाइल्डकार्ड वाला URL कोई सूचक नहीं है। उदाहरण के लिए, ऐसा कोई सूचकांक नहीं है जो स्कूलों के साथ शुरू होता है_परी -

POST /schools_pri*/_search?allow_no_indices = true

शरीर का अनुरोध करें

{
   "query":{
      "match_all":{}
   }
}

प्रतिक्रिया (कोई त्रुटि नहीं)

{
   "took":1,"timed_out": false, "_shards":{"total":0, "successful":0, "failed":0},
   "hits":{"total":0, "max_score":0.0, "hits":[]}
}

expand_wildcards

यह पैरामीटर तय करता है कि वाइल्डकार्ड्स को ओपन इंडेक्स या बंद इंडेक्स में विस्तारित करने की आवश्यकता है या दोनों का प्रदर्शन करना है। इस पैरामीटर का मान खुला और बंद या कोई भी और सभी हो सकता है।

उदाहरण के लिए, इंडेक्स स्कूलों को बंद करें -

POST /schools/_close

प्रतिक्रिया

{"acknowledged":true}

निम्नलिखित कोड पर विचार करें -

POST /school*/_search?expand_wildcards = closed

शरीर का अनुरोध करें

{
   "query":{
      "match_all":{}
   }
}

प्रतिक्रिया

{
   "error":{
      "root_cause":[{
         "type":"index_closed_exception", "reason":"closed", "index":"schools"
      }],
      "type":"index_closed_exception", "reason":"closed", "index":"schools"
   }, "status":403
}

इंडेक्स नामों में तारीख का समर्थन

एलिटिक्स खोज तिथि और समय के अनुसार सूचकांकों को खोजने के लिए एक कार्यक्षमता प्रदान करती है। हमें किसी विशिष्ट प्रारूप में दिनांक और समय निर्दिष्ट करना होगा। उदाहरण के लिए, accountdetail-2015.12.30, सूचकांक 30 दिसंबर 2015 के बैंक खाते के विवरण को संग्रहीत करेगा। किसी विशेष तिथि या तिथि और समय की सीमा के विवरण प्राप्त करने के लिए गणितीय संचालन किया जा सकता है।

दिनांक गणित सूचकांक नाम के लिए प्रारूप -

<static_name{date_math_expr{date_format|time_zone}}>
/<accountdetail-{now-2d{YYYY.MM.dd|utc}}>/_search

static_name अभिव्यक्ति का एक हिस्सा है जो खाता विवरण जैसे हर दिनांक गणित सूचकांक में समान रहता है। date_math_expr में गणितीय अभिव्यक्ति शामिल है जो अब -२ डी की तरह दिनांक और समय को निर्धारित करती है। date_format में वह प्रारूप होता है जिसमें तारीख YYYY.MM.dd जैसे सूचकांक में लिखी जाती है। यदि आज की तारीख 30 दिसंबर 2015 है, तो <accountdetail- {now-2d {YYYY.MM.dd}}> खाता-खाता-2015.12.28 वापस कर देगा।

अभिव्यक्ति को हल करता है
<Accountdetail- {अब-d}> accountdetail-2015/12/29
<Accountdetail- {अब एम}> accountdetail-2015/11/30
<Accountdetail- {{अब YYYY.MM}}> accountdetail-2015.12

अब हम एलिस्टिक्स खोज में उपलब्ध कुछ सामान्य विकल्पों को देखेंगे, जिनका उपयोग निर्दिष्ट प्रारूप में प्रतिक्रिया प्राप्त करने के लिए किया जा सकता है।

सुंदर परिणाम

हम एक अच्छी तरह से स्वरूपित JSON वस्तु में प्रतिक्रिया प्राप्त कर सकते हैं बस एक URL क्वेरी पैरामीटर, यानी, सुंदर = सच।

POST /schools/_search?pretty = true

शरीर का अनुरोध करें

{
   "query":{
      "match_all":{}
   }
}

प्रतिक्रिया

……………………..
{
   "_index" : "schools", "_type" : "school", "_id" : "1", "_score" : 1.0,
   "_source":{
      "name":"Central School", "description":"CBSE Affiliation",
      "street":"Nagan", "city":"paprola", "state":"HP", "zip":"176115",
      "location": [31.8955385, 76.8380405], "fees":2000,
      "tags":["Senior Secondary", "beautiful campus"], "rating":"3.5"
   }
}
………………….

मानव पठनीय आउटपुट

यह विकल्प सांख्यिकीय प्रतिक्रियाओं को या तो मानव पठनीय रूप में बदल सकता है (यदि मानव = सत्य) या कंप्यूटर पठनीय रूप (यदि मानव = असत्य)। उदाहरण के लिए, यदि मानव = सत्य तो दूरी_किलोमीटर = 20KM और यदि मानव = असत्य है तो दूरी_मीटर = 20000, जब प्रतिक्रिया को दूसरे कंप्यूटर प्रोग्राम द्वारा उपयोग करने की आवश्यकता होती है।

प्रतिक्रिया फ़िल्टरिंग

हम फ़ील्ड_पथ पैरामीटर में उन्हें जोड़कर कम फ़ील्ड्स की प्रतिक्रिया को फ़िल्टर कर सकते हैं। उदाहरण के लिए,

POST /schools/_search?filter_path = hits.total

शरीर का अनुरोध करें

{
   "query":{
      "match_all":{}
   }
}

प्रतिक्रिया

{"hits":{"total":3}}

इलास्टिक्स खोज एकल दस्तावेज़ एपीआई और बहु-दस्तावेज़ एपीआई प्रदान करता है, जहां एपीआई कॉल क्रमशः एक दस्तावेज़ और कई दस्तावेज़ों को लक्षित कर रहा है।

सूचकांक एपीआई

यह JSON दस्तावेज़ को इंडेक्स में जोड़ने या अपडेट करने में मदद करता है जब विशिष्ट मैपिंग के साथ उस संबंधित इंडेक्स के लिए अनुरोध किया जाता है। उदाहरण के लिए, निम्नलिखित अनुरोध JSON ऑब्जेक्ट को इंडेक्स स्कूलों और स्कूल मैपिंग के तहत जोड़ देगा -

PUT schools/_doc/5
{
   name":"City School", "description":"ICSE", "street":"West End",
   "city":"Meerut",
   "state":"UP", "zip":"250002", "location":[28.9926174, 77.692485],
   "fees":3500,
   "tags":["fully computerized"], "rating":"4.5"
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "schools",
   "_type" : "_doc",
   "_id" : "5",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 2,
   "_primary_term" : 1
}

स्वचालित सूचकांक निर्माण

जब किसी विशेष इंडेक्स में JSON ऑब्जेक्ट को जोड़ने का अनुरोध किया जाता है और यदि वह इंडेक्स मौजूद नहीं होता है, तो यह एपीआई स्वचालित रूप से उस इंडेक्स को बनाता है और उस विशेष JSON ऑब्जेक्ट के लिए अंतर्निहित मैपिंग भी। इस कार्यक्षमता को निम्न मापदंडों के मूल्यों को गलत में बदलकर अक्षम किया जा सकता है, जो कि इलास्टिसर्च.आईएमएल फ़ाइल में मौजूद हैं।

action.auto_create_index:false
index.mapper.dynamic:false

आप सूचकांक के ऑटो निर्माण को भी प्रतिबंधित कर सकते हैं, जहां केवल विशिष्ट पैटर्न के साथ सूचकांक का नाम निम्नलिखित पैरामीटर के मूल्य को बदलकर अनुमति देता है -

action.auto_create_index:+acc*,-bank*

Note - यहां + अनुमति दी गई है और इंगित करता है - अनुमति नहीं है।

संस्करण

इलास्टिसर्च भी संस्करण नियंत्रण सुविधा प्रदान करता है। हम किसी विशेष दस्तावेज़ के संस्करण को निर्दिष्ट करने के लिए एक संस्करण क्वेरी पैरामीटर का उपयोग कर सकते हैं।

PUT schools/_doc/5?version=7&version_type=external
{
   "name":"Central School", "description":"CBSE Affiliation", "street":"Nagan",
   "city":"paprola", "state":"HP", "zip":"176115", "location":[31.8955385, 76.8380405],
   "fees":2200, "tags":["Senior Secondary", "beautiful campus"], "rating":"3.3"
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "schools",
   "_type" : "_doc",
   "_id" : "5",
   "_version" : 7,
   "result" : "updated",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 3,
   "_primary_term" : 1
}

वर्जनिंग एक वास्तविक समय की प्रक्रिया है और यह वास्तविक समय के खोज कार्यों से प्रभावित नहीं होता है।

दो सबसे महत्वपूर्ण प्रकार के संस्करण हैं -

आंतरिक संस्करण

आंतरिक वर्जनिंग डिफ़ॉल्ट संस्करण है जो 1 से शुरू होता है और प्रत्येक अपडेट के साथ वेतन वृद्धि, हटाए गए शामिल हैं।

बाहरी संस्करण

इसका उपयोग तब किया जाता है जब दस्तावेजों की वर्जनिंग को किसी बाहरी सिस्टम जैसे थर्ड पार्टी वर्जनिंग सिस्टम में स्टोर किया जाता है। इस कार्यक्षमता को सक्षम करने के लिए, हमें version_type को बाहरी पर सेट करना होगा। यहां एलिस्टिक्सखोज संस्करण संख्या को बाहरी सिस्टम द्वारा निर्दिष्ट के रूप में संग्रहीत करेगा और उन्हें स्वचालित रूप से नहीं बढ़ाएगा।

ऑपरेशन का प्रकार

ऑपरेशन प्रकार का उपयोग ऑपरेशन बनाने के लिए किया जाता है। यह मौजूदा दस्तावेज़ के ओवरराइटिंग से बचने में मदद करता है।

PUT chapter/_doc/1?op_type=create
{
   "Text":"this is chapter one"
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "chapter",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 0,
   "_primary_term" : 1
}

स्वचालित आईडी पीढ़ी

जब ID को अनुक्रमणिका संचालन में निर्दिष्ट नहीं किया जाता है, तो Elasticsearch स्वचालित रूप से उस दस्तावेज़ के लिए आईडी बनाता है।

POST chapter/_doc/
{
   "user" : "tpoint",
   "post_date" : "2018-12-25T14:12:12",
   "message" : "Elasticsearch Tutorial"
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "chapter",
   "_type" : "_doc",
   "_id" : "PVghWGoB7LiDTeV6LSGu",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 1,
   "_primary_term" : 1
}

एपीआई प्राप्त करें

एपीआई किसी विशेष दस्तावेज़ के लिए अनुरोध प्राप्त करके टाइप JSON ऑब्जेक्ट को निकालने में मदद करता है।

pre class="prettyprint notranslate" > GET schools/_doc/5

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "schools",
   "_type" : "_doc",
   "_id" : "5",
   "_version" : 7,
   "_seq_no" : 3,
   "_primary_term" : 1,
   "found" : true,
   "_source" : {
      "name" : "Central School",
      "description" : "CBSE Affiliation",
      "street" : "Nagan",
      "city" : "paprola",
      "state" : "HP",
      "zip" : "176115",
      "location" : [
         31.8955385,
         76.8380405
      ],
      "fees" : 2200,
      "tags" : [
         "Senior Secondary",
         "beautiful campus"
      ],
      "rating" : "3.3"
   }
}
  • यह ऑपरेशन वास्तविक समय है और सूचकांक की ताज़ा दर से प्रभावित नहीं होता है।

  • आप संस्करण को निर्दिष्ट भी कर सकते हैं, फिर एलीस्टेकर्च केवल दस्तावेज़ के उस संस्करण को लाएगा।

  • आप अनुरोध में _all भी निर्दिष्ट कर सकते हैं, ताकि एलेस्टिक्स खोज उस दस्तावेज़ आईडी को हर प्रकार से खोज सके और यह पहले मिलान किए गए दस्तावेज़ को वापस कर देगा।

  • आप उस विशेष दस्तावेज़ से अपने परिणाम में अपने इच्छित फ़ील्ड भी निर्दिष्ट कर सकते हैं।

GET schools/_doc/5?_source_includes=name,fees

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "schools",
   "_type" : "_doc",
   "_id" : "5",
   "_version" : 7,
   "_seq_no" : 3,
   "_primary_term" : 1,
   "found" : true,
   "_source" : {
      "fees" : 2200,
      "name" : "Central School"
   }
}

आप अपने रिक्वेस्ट में सिर्फ _source हिस्सा जोड़कर अपने रिजल्ट में सोर्स पार्ट भी ला सकते हैं।

GET schools/_doc/5?_source

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "schools",
   "_type" : "_doc",
   "_id" : "5",
   "_version" : 7,
   "_seq_no" : 3,
   "_primary_term" : 1,
   "found" : true,
   "_source" : {
      "name" : "Central School",
      "description" : "CBSE Affiliation",
      "street" : "Nagan",
      "city" : "paprola",
      "state" : "HP",
      "zip" : "176115",
      "location" : [
         31.8955385,
         76.8380405
      ],
      "fees" : 2200,
      "tags" : [
         "Senior Secondary",
         "beautiful campus"
      ],
      "rating" : "3.3"
   }
}

सही करने के लिए सेट रिफ्रेश पैरामीटर द्वारा ऑपरेशन करने से पहले आप शार्ड को रिफ्रेश भी कर सकते हैं।

एपीआई हटाएं

आप किसी विशेष इंडेक्स, मैपिंग या डॉक्यूमेंट को डिलीट कर सकते हैं, जो एलिस्टिक्स सर्च को HTTP DELETE रिक्वेस्ट भेज सकते हैं।

DELETE schools/_doc/4

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "found":true, "_index":"schools", "_type":"school", "_id":"4", "_version":2,
   "_shards":{"total":2, "successful":1, "failed":0}
}

दस्तावेज़ के संस्करण को उस विशेष संस्करण को हटाने के लिए निर्दिष्ट किया जा सकता है। रूटिंग पैरामीटर को किसी विशेष उपयोगकर्ता से दस्तावेज़ को हटाने के लिए निर्दिष्ट किया जा सकता है और यदि दस्तावेज़ उस विशेष उपयोगकर्ता से संबंधित नहीं है, तो ऑपरेशन विफल हो जाता है। इस ऑपरेशन में, आप GET API की तरह ही रिफ्रेश और टाइमआउट विकल्प निर्दिष्ट कर सकते हैं।

एपीआई अद्यतन करें

इस ऑपरेशन को करने के लिए स्क्रिप्ट का उपयोग किया जाता है और यह सुनिश्चित करने के लिए संस्करण का उपयोग किया जाता है कि गेट और री-इंडेक्स के दौरान कोई अपडेट नहीं हुआ है। उदाहरण के लिए, आप स्क्रिप्ट का उपयोग करके स्कूल की फीस अपडेट कर सकते हैं -

POST schools/_update/4
{
   "script" : {
      "source": "ctx._source.name = params.sname",
      "lang": "painless",
      "params" : {
         "sname" : "City Wise School"
      }
   }
 }

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "schools",
   "_type" : "_doc",
   "_id" : "4",
   "_version" : 3,
   "result" : "updated",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 4,
   "_primary_term" : 2
}

आप अद्यतन दस्तावेज़ के लिए अनुरोध प्राप्त करके अपडेट की जांच कर सकते हैं।

इस एपीआई का उपयोग एलिस्टिक्स खोज में सामग्री खोजने के लिए किया जाता है। एक उपयोगकर्ता पैरामीटर के रूप में क्वेरी स्ट्रिंग के साथ एक अनुरोध प्राप्त करके खोज कर सकता है या वे पोस्ट अनुरोध के संदेश निकाय में एक क्वेरी पोस्ट कर सकते हैं। मुख्य रूप से सभी खोज एपीआईएस बहु-सूचकांक, बहु-प्रकार हैं।

बहु सूचकांक

इलास्टिसर्च हमें सभी सूचकांकों में या कुछ विशिष्ट सूचकांकों में मौजूद दस्तावेजों की खोज करने की अनुमति देता है। उदाहरण के लिए, यदि हमें सभी दस्तावेजों को एक नाम के साथ खोजना है जिसमें केंद्रीय शामिल है, तो हम यहां दिखाए गए अनुसार कर सकते हैं -

GET /_all/_search?q=city:paprola

उपरोक्त कोड चलाने पर, हमें निम्नलिखित प्रतिक्रिया मिलती है -

{
   "took" : 33,
   "timed_out" : false,
   "_shards" : {
      "total" : 7,
      "successful" : 7,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 1,
         "relation" : "eq"
      },
      "max_score" : 0.9808292,
      "hits" : [
         {
            "_index" : "schools",
            "_type" : "school",
            "_id" : "5",
            "_score" : 0.9808292,
            "_source" : {
               "name" : "Central School",
               "description" : "CBSE Affiliation",
               "street" : "Nagan",
               "city" : "paprola",
               "state" : "HP",
               "zip" : "176115",
               "location" : [
                  31.8955385,
                  76.8380405
               ],
               "fees" : 2200,
               "tags" : [
                  "Senior Secondary",
                  "beautiful campus"
               ],
               "rating" : "3.3"
            }
         }
      ]
   }
}

URI खोज

यूनिफ़ॉर्म रिसोर्स आइडेंटिफ़ायर का उपयोग करके एक खोज ऑपरेशन में कई मापदंडों को पारित किया जा सकता है -

S.No पैरामीटर और विवरण
1

Q

क्वेरी स्ट्रिंग निर्दिष्ट करने के लिए इस पैरामीटर का उपयोग किया जाता है।

2

lenient

इस पैरामीटर का उपयोग क्वेरी स्ट्रिंग निर्दिष्ट करने के लिए किया जाता है। इस पैरामीटर को सही पर सेट करने से आधारित त्रुटियों को अनदेखा किया जा सकता है। यह डिफ़ॉल्ट रूप से गलत है।

3

fields

क्वेरी स्ट्रिंग निर्दिष्ट करने के लिए इस पैरामीटर का उपयोग किया जाता है।

4

sort

हम इस पैरामीटर का उपयोग करके क्रमबद्ध परिणाम प्राप्त कर सकते हैं, इस पैरामीटर के लिए संभावित मान फिल्नाम, फ़ील्डनाम: asc / fieldname: desc है

5

timeout

हम इस पैरामीटर का उपयोग करके खोज समय को सीमित कर सकते हैं और प्रतिक्रिया में केवल उस निर्दिष्ट समय में हिट शामिल हैं। डिफ़ॉल्ट रूप से, कोई टाइमआउट नहीं है।

6

terminate_after

हम प्रत्येक शार्क के लिए निर्दिष्ट दस्तावेज़ों की प्रतिक्रिया को प्रतिबंधित कर सकते हैं, जिस पर पहुंचने पर क्वेरी जल्दी समाप्त हो जाएगी। डिफ़ॉल्ट रूप से, कोई terminate_after नहीं है।

7

from

हिट करने के लिए इंडेक्स से शुरुआत। चूक ०।

8

size

यह लौटने के लिए हिट की संख्या को दर्शाता है। 10 से चूक।

शारीरिक खोज का अनुरोध करें

हम अनुरोध बॉडी में क्वेरी डीएसएल का उपयोग करके क्वेरी भी निर्दिष्ट कर सकते हैं और पिछले अध्यायों में पहले से दिए गए कई उदाहरण हैं। ऐसा ही एक उदाहरण यहाँ दिया गया है -

POST /schools/_search
{
   "query":{
      "query_string":{
         "query":"up"
      }
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित प्रतिक्रिया मिलती है -

{
   "took" : 11,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 1,
         "relation" : "eq"
      },
      "max_score" : 0.47000363,
      "hits" : [
         {
            "_index" : "schools",
            "_type" : "school",
            "_id" : "4",
            "_score" : 0.47000363,
            "_source" : {
               "name" : "City Best School",
               "description" : "ICSE",
               "street" : "West End",
               "city" : "Meerut",
               "state" : "UP",
               "zip" : "250002",
               "location" : [
                  28.9926174,
                  77.692485
               ],
               "fees" : 3500,
               "tags" : [
                  "fully computerized"
               ],
               "rating" : "4.5"
            }
         }
      ]
   }
}

एकत्रीकरण ढांचा खोज क्वेरी द्वारा चुने गए सभी डेटा को इकट्ठा करता है और इसमें कई बिल्डिंग ब्लॉक होते हैं, जो डेटा के जटिल सारांश बनाने में मदद करते हैं। एक एकत्रीकरण की मूल संरचना यहाँ दिखाई गई है -

"aggregations" : {
   "" : {
      "" : {

      }
 
      [,"meta" : { [] } ]?
      [,"aggregations" : { []+ } ]?
   }
   [,"" : { ... } ]*
}

विभिन्न प्रकार के एकत्रीकरण हैं, प्रत्येक का अपना उद्देश्य है। इस अध्याय में उन पर विस्तार से चर्चा की गई है।

मेट्रिक्स एग्रीगेशन

ये एकत्रीकरण समग्र दस्तावेजों के क्षेत्र के मूल्यों से मैट्रिसेस की गणना करने में मदद करते हैं और कुछ समय में कुछ मान स्क्रिप्ट से उत्पन्न किए जा सकते हैं।

न्यूमेरिक मैट्रीज़ या तो औसत-एग्रीगेशन की तरह मूल्यवान हैं या आँकड़ों की तरह बहु-मूल्यवान हैं।

औसत एकत्रीकरण

इस एकत्रीकरण का उपयोग कुल दस्तावेजों में मौजूद किसी भी संख्यात्मक क्षेत्र का औसत प्राप्त करने के लिए किया जाता है। उदाहरण के लिए,

POST /schools/_search
{
   "aggs":{
      "avg_fees":{"avg":{"field":"fees"}}
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 41,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : 1.0,
      "hits" : [
         {
            "_index" : "schools",
            "_type" : "school",
            "_id" : "5",
            "_score" : 1.0,
            "_source" : {
               "name" : "Central School",
               "description" : "CBSE Affiliation",
               "street" : "Nagan",
               "city" : "paprola",
               "state" : "HP",
               "zip" : "176115",
               "location" : [
                  31.8955385,
                  76.8380405
               ],
            "fees" : 2200,
            "tags" : [
               "Senior Secondary",
               "beautiful campus"
            ],
            "rating" : "3.3"
         }
      },
      {
         "_index" : "schools",
         "_type" : "school",
         "_id" : "4",
         "_score" : 1.0,
         "_source" : {
            "name" : "City Best School",
            "description" : "ICSE",
            "street" : "West End",
            "city" : "Meerut",
            "state" : "UP",
            "zip" : "250002",
            "location" : [
               28.9926174,
               77.692485
            ],
            "fees" : 3500,
            "tags" : [
               "fully computerized"
            ],
            "rating" : "4.5"
         }
      }
   ]
 },
   "aggregations" : {
      "avg_fees" : {
         "value" : 2850.0
      }
   }
}

कार्डिनैलिटी एग्रीगेशन

यह एकत्रीकरण एक विशेष क्षेत्र के विभिन्न मूल्यों की गिनती देता है।

POST /schools/_search?size=0
{
   "aggs":{
      "distinct_name_count":{"cardinality":{"field":"fees"}}
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 2,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : null,
      "hits" : [ ]
   },
   "aggregations" : {
      "distinct_name_count" : {
         "value" : 2
      }
   }
}

Note - कार्डिनैलिटी का मूल्य 2 है क्योंकि फीस में दो अलग-अलग मूल्य हैं।

विस्तारित आँकड़े एकत्रीकरण

यह एकत्रीकरण कुल दस्तावेजों में एक विशिष्ट संख्यात्मक क्षेत्र के बारे में सभी आंकड़े उत्पन्न करता है।

POST /schools/_search?size=0
{
   "aggs" : {
      "fees_stats" : { "extended_stats" : { "field" : "fees" } }
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 8,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : null,
      "hits" : [ ]
   },
   "aggregations" : {
      "fees_stats" : {
         "count" : 2,
         "min" : 2200.0,
         "max" : 3500.0,
         "avg" : 2850.0,
         "sum" : 5700.0,
         "sum_of_squares" : 1.709E7,
         "variance" : 422500.0,
         "std_deviation" : 650.0,
         "std_deviation_bounds" : {
            "upper" : 4150.0,
            "lower" : 1550.0
         }
      }
   }
}

अधिकतम एकत्रीकरण

यह एकत्रीकरण कुल दस्तावेजों में एक विशिष्ट संख्यात्मक क्षेत्र का अधिकतम मूल्य पाता है।

POST /schools/_search?size=0
{
   "aggs" : {
   "max_fees" : { "max" : { "field" : "fees" } }
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 16,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
  "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : null,
      "hits" : [ ]
   },
   "aggregations" : {
      "max_fees" : {
         "value" : 3500.0
      }
   }
}

न्यूनतम एकत्रीकरण

यह एकत्रीकरण कुल दस्तावेजों में एक विशिष्ट संख्यात्मक क्षेत्र का न्यूनतम मूल्य पाता है।

POST /schools/_search?size=0
{
   "aggs" : {
      "min_fees" : { "min" : { "field" : "fees" } }
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 2,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : null,
      "hits" : [ ]
   },
  "aggregations" : {
      "min_fees" : {
         "value" : 2200.0
      }
   }
}

सम योग

यह एकत्रीकरण कुल दस्तावेजों में एक विशिष्ट संख्यात्मक क्षेत्र की राशि की गणना करता है।

POST /schools/_search?size=0
{
   "aggs" : {
      "total_fees" : { "sum" : { "field" : "fees" } }
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 8,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : null,
      "hits" : [ ]
   },
   "aggregations" : {
      "total_fees" : {
         "value" : 5700.0
      }
   }
}

कुछ अन्य मैट्रिक्स एकत्रीकरण हैं जो विशेष मामलों में उपयोग किए जाते हैं जैसे कि जियो सीमा के एकत्रीकरण और भू स्थान के उद्देश्य के लिए जियो सेंट्रोइड एकत्रीकरण।

आँकड़े एकत्र

एक बहु-मूल्य मीट्रिक एकत्रीकरण जो कुल दस्तावेजों से निकाले गए संख्यात्मक मूल्यों से अधिक आँकड़ों की गणना करता है।

POST /schools/_search?size=0
{
   "aggs" : {
      "grades_stats" : { "stats" : { "field" : "fees" } }
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 2,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : null,
      "hits" : [ ]
   },
   "aggregations" : {
      "grades_stats" : {
         "count" : 2,
         "min" : 2200.0,
         "max" : 3500.0,
         "avg" : 2850.0,
         "sum" : 5700.0
      }
   }
}

एकत्रीकरण मेटाडेटा

आप मेटा टैग का उपयोग करके अनुरोध के समय एकत्रीकरण के बारे में कुछ डेटा जोड़ सकते हैं और प्रतिक्रिया में प्राप्त कर सकते हैं।

POST /schools/_search?size=0
{
   "aggs" : {
      "min_fees" : { "avg" : { "field" : "fees" } ,
         "meta" :{
            "dsc" :"Lowest Fees This Year"
         }
      }
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 0,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : null,
      "hits" : [ ]
   },
   "aggregations" : {
      "min_fees" : {
         "meta" : {
            "dsc" : "Lowest Fees This Year"
         },
         "value" : 2850.0
      }
   }
}

ये API इंडेक्स के सभी पहलुओं जैसे कि सेटिंग्स, उपनाम, मैपिंग, इंडेक्स टेम्प्लेट के प्रबंधन के लिए जिम्मेदार हैं।

सूचकांक बनाएँ

यह API आपको एक इंडेक्स बनाने में मदद करता है। जब उपयोगकर्ता JSON ऑब्जेक्ट्स को किसी भी इंडेक्स में पास कर रहा होता है, तो एक इंडेक्स स्वचालित रूप से बनाया जा सकता है या इससे पहले इसे बनाया जा सकता है। एक इंडेक्स बनाने के लिए, आपको बस सेटिंग्स, मैपिंग और उपनाम के साथ एक पीयूटी अनुरोध भेजने की आवश्यकता है या शरीर के बिना बस एक साधारण अनुरोध।

PUT colleges

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार आउटपुट मिलता है -

{
   "acknowledged" : true,
   "shards_acknowledged" : true,
   "index" : "colleges"
}

हम उपरोक्त कमांड में कुछ सेटिंग्स भी जोड़ सकते हैं -

PUT colleges
{
  "settings" : {
      "index" : {
         "number_of_shards" : 3,
         "number_of_replicas" : 2
      }
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार आउटपुट मिलता है -

{
   "acknowledged" : true,
   "shards_acknowledged" : true,
   "index" : "colleges"
}

सूचकांक हटाएं

यह एपीआई आपको किसी भी सूचकांक को हटाने में मदद करता है। आपको बस उस विशेष इंडेक्स के नाम के साथ एक डिलीट रिक्वेस्ट पास करनी होगी।

DELETE /colleges

आप केवल _all या * का उपयोग करके सभी सूचकांकों को हटा सकते हैं।

सूचकांक प्राप्त करें

इस एपीआई को केवल एक या एक से अधिक सूचकांकों के लिए अनुरोध प्राप्त करके भेजा जा सकता है। यह सूचकांक के बारे में जानकारी देता है।

GET colleges

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार आउटपुट मिलता है -

{
   "colleges" : {
      "aliases" : {
         "alias_1" : { },
         "alias_2" : {
            "filter" : {
               "term" : {
                  "user" : "pkay"
               }
            },
            "index_routing" : "pkay",
            "search_routing" : "pkay"
         }
      },
      "mappings" : { },
      "settings" : {
         "index" : {
            "creation_date" : "1556245406616",
            "number_of_shards" : "1",
            "number_of_replicas" : "1",
            "uuid" : "3ExJbdl2R1qDLssIkwDAug",
            "version" : {
               "created" : "7000099"
            },
            "provided_name" : "colleges"
         }
      }
   }
}

आप सभी सूचकांकों की जानकारी _all या * का उपयोग करके प्राप्त कर सकते हैं।

सूचकांक अस्तित्व

किसी सूचकांक का अस्तित्व केवल उस सूचकांक के लिए एक अनुरोध भेजने के द्वारा निर्धारित किया जा सकता है। यदि HTTP प्रतिक्रिया 200 है, तो यह मौजूद है; यदि यह 404 है, तो इसका अस्तित्व नहीं है।

HEAD colleges

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार आउटपुट मिलता है -

200-OK

सूचकांक सेटिंग्स

आप URL के अंत में सिर्फ _settings कीवर्ड जोड़कर सूचकांक सेटिंग्स प्राप्त कर सकते हैं।

GET /colleges/_settings

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार आउटपुट मिलता है -

{
   "colleges" : {
      "settings" : {
         "index" : {
            "creation_date" : "1556245406616",
            "number_of_shards" : "1",
            "number_of_replicas" : "1",
            "uuid" : "3ExJbdl2R1qDLssIkwDAug",
            "version" : {
               "created" : "7000099"
            },
            "provided_name" : "colleges"
         }
      }
   }
}

सूचकांक आँकड़े

यह एपीआई आपको किसी विशेष सूचकांक के बारे में आँकड़े निकालने में मदद करता है। आपको अंत में इंडेक्स URL और _stats कीवर्ड के साथ एक अनुरोध प्राप्त करना होगा।

GET /_stats

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार आउटपुट मिलता है -

………………………………………………
},
   "request_cache" : {
      "memory_size_in_bytes" : 849,
      "evictions" : 0,
      "hit_count" : 1171,
      "miss_count" : 4
   },
   "recovery" : {
      "current_as_source" : 0,
      "current_as_target" : 0,
      "throttle_time_in_millis" : 0
   }
} ………………………………………………

लालिमा

एक सूचकांक की फ्लश प्रक्रिया यह सुनिश्चित करती है कि कोई डेटा जो वर्तमान में केवल लेन-देन लॉग में बना हुआ है, वह भी स्थायी रूप से ल्यूसिन में बना रहता है। यह पुनर्प्राप्ति समय को कम करता है क्योंकि ल्यूकेन अनुक्रमित खोले जाने के बाद डेटा को लेन-देन लॉग से फिर से जोड़ने की आवश्यकता नहीं होती है।

POST colleges/_flush

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार आउटपुट मिलता है -

{
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   } 
}

आमतौर पर विभिन्न इलास्टिक्स खोज एपीआई के परिणाम JSON प्रारूप में प्रदर्शित किए जाते हैं। लेकिन JSON को हमेशा पढ़ना आसान नहीं है। तो कैट एपीआई की सुविधा एलिस्टिक्सखोज में उपलब्ध है, पढ़ने में आसानी देने और परिणामों के मुद्रण प्रारूप को समझने में मदद करता है। बिल्ली एपीआई में विभिन्न मापदंडों का उपयोग किया जाता है, जो सर्वर का अलग उद्देश्य होता है, उदाहरण के लिए - वी शब्द आउटपुट क्रिया करता है।

आइए इस अध्याय में बिल्ली एपीआई के बारे में विस्तार से जानें।

वाचाल

वर्बोज़ आउटपुट कैट कमांड के परिणामों का अच्छा प्रदर्शन देता है। नीचे दिए गए उदाहरण में, हमें क्लस्टर में मौजूद विभिन्न सूचकांकों का विवरण मिलता है।

GET /_cat/indices?v

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
yellow open schools RkMyEn2SQ4yUgzT6EQYuAA 1 1 2 1 21.6kb 21.6kb
yellow open index_4_analysis zVmZdM1sTV61YJYrNXf1gg 1 1 0 0 283b 283b
yellow open sensor-2018-01-01 KIrrHwABRB-ilGqTu3OaVQ 1 1 1 0 4.2kb 4.2kb
yellow open colleges 3ExJbdl2R1qDLssIkwDAug 1 1 0 0 283b 283b

हेडर

H पैरामीटर, जिसे हेडर भी कहा जाता है, का उपयोग केवल कमांड में उल्लिखित उन कॉलम को प्रदर्शित करने के लिए किया जाता है।

GET /_cat/nodes?h=ip,port

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

127.0.0.1 9300

तरह

सॉर्ट कमांड क्वेरी स्ट्रिंग को स्वीकार करता है जो क्वेरी में निर्दिष्ट कॉलम द्वारा तालिका को सॉर्ट कर सकता है। डिफ़ॉल्ट सॉर्ट आरोही है लेकिन इसे किसी कॉलम में डीएससी: जोड़कर बदला जा सकता है।

नीचे दिए गए उदाहरण, दर्ज किए गए सूचकांक पैटर्न के अवरोही क्रम में व्यवस्थित टेम्पलेट्स का एक परिणाम देता है।

GET _cat/templates?v&s=order:desc,index_patterns

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

name index_patterns order version
.triggered_watches [.triggered_watches*] 2147483647
.watch-history-9 [.watcher-history-9*] 2147483647
.watches [.watches*] 2147483647
.kibana_task_manager [.kibana_task_manager] 0 7000099

गिनती

गणना पैरामीटर पूरे क्लस्टर में दस्तावेजों की कुल संख्या की गिनती प्रदान करता है।

GET /_cat/count?v

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

epoch timestamp count
1557633536 03:58:56 17809

क्लस्टर API का उपयोग क्लस्टर और उसके नोड्स के बारे में जानकारी प्राप्त करने और उनमें परिवर्तन करने के लिए किया जाता है। इस API को कॉल करने के लिए, हमें नोड नाम, पता या _local निर्दिष्ट करना होगा।

GET /_nodes/_local

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

………………………………………………
cluster_name" : "elasticsearch",
   "nodes" : {
      "FKH-5blYTJmff2rJ_lQOCg" : {
         "name" : "ubuntu",
         "transport_address" : "127.0.0.1:9300",
         "host" : "127.0.0.1",
         "ip" : "127.0.0.1",
         "version" : "7.0.0",
         "build_flavor" : "default",
         "build_type" : "tar",
         "build_hash" : "b7e28a7",
         "total_indexing_buffer" : 106502553,
         "roles" : [
            "master",
            "data",
            "ingest"
         ],
         "attributes" : {
………………………………………………

क्लस्टर स्वास्थ्य

इस API का उपयोग 'स्वास्थ्य' कीवर्ड को जोड़कर क्लस्टर के स्वास्थ्य पर स्थिति प्राप्त करने के लिए किया जाता है।

GET /_cluster/health

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "cluster_name" : "elasticsearch",
   "status" : "yellow",
   "timed_out" : false,
   "number_of_nodes" : 1,
   "number_of_data_nodes" : 1,
   "active_primary_shards" : 7,
   "active_shards" : 7,
   "relocating_shards" : 0,
   "initializing_shards" : 0,
   "unassigned_shards" : 4,
   "delayed_unassigned_shards" : 0,
   "number_of_pending_tasks" : 0,
   "number_of_in_flight_fetch" : 0,
   "task_max_waiting_in_queue_millis" : 0,
   "active_shards_percent_as_number" : 63.63636363636363
}

क्लस्टर राज्य

इस API का उपयोग 'राज्य' कीवर्ड URL को जोड़कर एक क्लस्टर के बारे में राज्य की जानकारी प्राप्त करने के लिए किया जाता है। राज्य की जानकारी में संस्करण, मास्टर नोड, अन्य नोड्स, राउटिंग टेबल, मेटाडेटा और ब्लॉक शामिल हैं।

GET /_cluster/state

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

………………………………………………
{
   "cluster_name" : "elasticsearch",
   "cluster_uuid" : "IzKu0OoVTQ6LxqONJnN2eQ",
   "version" : 89,
   "state_uuid" : "y3BlwvspR1eUQBTo0aBjig",
   "master_node" : "FKH-5blYTJmff2rJ_lQOCg",
   "blocks" : { },
   "nodes" : {
      "FKH-5blYTJmff2rJ_lQOCg" : {
      "name" : "ubuntu",
      "ephemeral_id" : "426kTGpITGixhEzaM-5Qyg",
      "transport
   }
………………………………………………

क्लस्टर आँकड़े

यह API 'आँकड़े' कीवर्ड का उपयोग करके क्लस्टर के बारे में आँकड़े पुनः प्राप्त करने में मदद करता है। यह एपीआई शार्प नंबर, स्टोर साइज, मेमोरी यूसेज, नोड्स, रोल्स, ओएस और फाइल सिस्टम की रिटर्न देता है।

GET /_cluster/stats

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

………………………………………….
"cluster_name" : "elasticsearch",
"cluster_uuid" : "IzKu0OoVTQ6LxqONJnN2eQ",
"timestamp" : 1556435464704,
"status" : "yellow",
"indices" : {
   "count" : 7,
   "shards" : {
      "total" : 7,
      "primaries" : 7,
      "replication" : 0.0,
      "index" : {
         "shards" : {
         "min" : 1,
         "max" : 1,
         "avg" : 1.0
      },
      "primaries" : {
         "min" : 1,
         "max" : 1,
         "avg" : 1.0
      },
      "replication" : {
         "min" : 0.0,
         "max" : 0.0,
         "avg" : 0.0
      }
………………………………………….

क्लस्टर अद्यतन सेटिंग्स

यह एपीआई आपको 'सेटिंग' कीवर्ड का उपयोग करके क्लस्टर की सेटिंग को अपडेट करने की अनुमति देता है। दो प्रकार की सेटिंग्स हैं - लगातार (पुनरारंभ पर लागू) और क्षणिक (एक पूर्ण क्लस्टर पुनरारंभ से बच नहीं)।

नोड आँकड़े

इस API का उपयोग क्लस्टर के एक और नोड के आँकड़े प्राप्त करने के लिए किया जाता है। नोड आँकड़े क्लस्टर के समान ही होते हैं।

GET /_nodes/stats

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "_nodes" : {
      "total" : 1,
      "successful" : 1,
      "failed" : 0
   },
   "cluster_name" : "elasticsearch",
   "nodes" : {
      "FKH-5blYTJmff2rJ_lQOCg" : {
         "timestamp" : 1556437348653,
         "name" : "ubuntu",
         "transport_address" : "127.0.0.1:9300",
         "host" : "127.0.0.1",
         "ip" : "127.0.0.1:9300",
         "roles" : [
            "master",
            "data",
            "ingest"
         ],
         "attributes" : {
            "ml.machine_memory" : "4112797696",
            "xpack.installed" : "true",
            "ml.max_open_jobs" : "20"
         },
………………………………………………………….

नोड्स हॉट_थ्रेड्स

यह API आपको क्लस्टर में प्रत्येक नोड पर वर्तमान हॉट थ्रेड्स के बारे में जानकारी प्राप्त करने में मदद करता है।

GET /_nodes/hot_threads

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

:::{ubuntu}{FKH-5blYTJmff2rJ_lQOCg}{426kTGpITGixhEzaM5Qyg}{127.0.0.1}{127.0.0.1:9300}{ml.machine_memory=4112797696,
xpack.installed=true, ml.max_open_jobs=20}
 Hot threads at 2019-04-28T07:43:58.265Z, interval=500ms, busiestThreads=3,
ignoreIdleThreads=true:

इलास्टिक्स खोज में, JSON के आधार पर क्वेरी का उपयोग करके खोज की जाती है। एक क्वेरी दो खंडों से बनी है -

  • Leaf Query Clauses - ये खंड मैच, टर्म या रेंज हैं, जो विशिष्ट क्षेत्र में एक विशिष्ट मूल्य की तलाश करते हैं।

  • Compound Query Clauses - ये क्वेरीज़ वांछित जानकारी निकालने के लिए लीफ क्वेरी क्लॉज़ और अन्य यौगिक क्वेरीज़ का संयोजन हैं।

इलास्टिसर्च बड़ी संख्या में प्रश्नों का समर्थन करता है। एक क्वेरी एक क्वेरी कुंजी शब्द से शुरू होती है और फिर JSON ऑब्जेक्ट के रूप में अंदर स्थितियां और फ़िल्टर होते हैं। नीचे विभिन्न प्रकार के प्रश्नों का वर्णन किया गया है।

मैच सभी क्वेरी

यह सबसे बुनियादी प्रश्न है; यह सभी सामग्री और 1.0 के स्कोर के साथ हर वस्तु के लिए देता है।

POST /schools/_search
{
   "query":{
      "match_all":{}
   }
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "took" : 7,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : 1.0,
      "hits" : [
         {
            "_index" : "schools",
            "_type" : "school",
            "_id" : "5",
            "_score" : 1.0,
            "_source" : {
               "name" : "Central School",
               "description" : "CBSE Affiliation",
               "street" : "Nagan",
               "city" : "paprola",
               "state" : "HP",
               "zip" : "176115",
               "location" : [
                  31.8955385,
                  76.8380405
               ],
               "fees" : 2200,
               "tags" : [
                  "Senior Secondary",
                  "beautiful campus"
               ],
               "rating" : "3.3"
            }
         },
         {
            "_index" : "schools",
            "_type" : "school",
            "_id" : "4",
            "_score" : 1.0,
            "_source" : {
               "name" : "City Best School",
               "description" : "ICSE",
               "street" : "West End",
               "city" : "Meerut",
               "state" : "UP",
               "zip" : "250002",
               "location" : [
                  28.9926174,
                  77.692485
               ],
               "fees" : 3500,
               "tags" : [
                  "fully computerized"
               ],
               "rating" : "4.5"
            }
         }
      ]
   }
}

पूर्ण पाठ प्रश्न

इन प्रश्नों का उपयोग एक अध्याय या समाचार लेख की तरह पाठ की पूरी बॉडी को खोजने के लिए किया जाता है। यह क्वेरी उस विशेष सूचकांक या दस्तावेज़ से जुड़े विश्लेषक के अनुसार काम करती है। इस भाग में, हम विभिन्न प्रकार के पूर्ण पाठ प्रश्नों पर चर्चा करेंगे।

मैच की क्वेरी

यह क्वेरी एक या अधिक फ़ील्ड के मानों के साथ एक पाठ या वाक्यांश से मेल खाती है।

POST /schools*/_search
{
   "query":{
      "match" : {
         "rating":"4.5"
      }
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "took" : 44,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 1,
         "relation" : "eq"
      },
      "max_score" : 0.47000363,
      "hits" : [
         {
            "_index" : "schools",
            "_type" : "school",
            "_id" : "4",
            "_score" : 0.47000363,
            "_source" : {
               "name" : "City Best School",
               "description" : "ICSE",
               "street" : "West End",
               "city" : "Meerut",
               "state" : "UP",
               "zip" : "250002",
               "location" : [
                  28.9926174,
                  77.692485
               ],
               "fees" : 3500,
               "tags" : [
                  "fully computerized"
               ],
               "rating" : "4.5"
            }
         }
      ]
   }
}

मल्टी मैच क्वेरी

यह क्वेरी एक से अधिक फ़ील्ड के साथ टेक्स्ट या वाक्यांश से मेल खाती है।

POST /schools*/_search
{
   "query":{
      "multi_match" : {
         "query": "paprola",
         "fields": [ "city", "state" ]
      }
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "took" : 12,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 1,
         "relation" : "eq"
      },
      "max_score" : 0.9808292,
      "hits" : [
         {
            "_index" : "schools",
            "_type" : "school",
            "_id" : "5",
            "_score" : 0.9808292,
            "_source" : {
               "name" : "Central School",
               "description" : "CBSE Affiliation",
               "street" : "Nagan",
               "city" : "paprola",
               "state" : "HP",
               "zip" : "176115",
               "location" : [
                  31.8955385,
                  76.8380405
               ],
               "fees" : 2200,
               "tags" : [
                  "Senior Secondary",
                  "beautiful campus"
               ],
               "rating" : "3.3"
            }
         }
      ]
   }
}

क्वेरी स्ट्रिंग क्वेरी

यह क्वेरी क्वेरी पार्सर और query_string कीवर्ड का उपयोग करती है।

POST /schools*/_search
{
   "query":{
      "query_string":{
         "query":"beautiful"
      }
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "took" : 60,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
      "value" : 1,
      "relation" : "eq"
   },
………………………………….

शब्द स्तर प्रश्न

ये प्रश्न मुख्य रूप से संरचित डेटा जैसे नंबर, दिनांक और एनम से निपटते हैं।

POST /schools*/_search
{
   "query":{
      "term":{"zip":"176115"}
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

……………………………..
hits" : [
   {
      "_index" : "schools",
      "_type" : "school",
      "_id" : "5",
      "_score" : 0.9808292,
      "_source" : {
         "name" : "Central School",
         "description" : "CBSE Affiliation",
         "street" : "Nagan",
         "city" : "paprola",
         "state" : "HP",
         "zip" : "176115",
         "location" : [
            31.8955385,
            76.8380405
         ],
      }
   }
]   
…………………………………………..

रेंज क्वेरी

इस क्वेरी का उपयोग दिए गए मानों की श्रेणियों के बीच मान रखने वाली वस्तुओं को खोजने के लिए किया जाता है। इसके लिए, हमें ऑपरेटरों का उपयोग करने की आवश्यकता है जैसे -

  • gte - के बराबर से अधिक
  • gt - अधिक से अधिक
  • lte - के बराबर-से-कम
  • lt - कम-से-कम

उदाहरण के लिए, नीचे दिए गए कोड को देखें -

POST /schools*/_search
{
   "query":{
      "range":{
         "rating":{
            "gte":3.5
         }
      }
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "took" : 24,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 1,
         "relation" : "eq"
      },
      "max_score" : 1.0,
      "hits" : [
         {
            "_index" : "schools",
            "_type" : "school",
            "_id" : "4",
            "_score" : 1.0,
            "_source" : {
               "name" : "City Best School",
               "description" : "ICSE",
               "street" : "West End",
               "city" : "Meerut",
               "state" : "UP",
               "zip" : "250002",
               "location" : [
                  28.9926174,
                  77.692485
               ],
               "fees" : 3500,
               "tags" : [
                  "fully computerized"
               ],
               "rating" : "4.5"
            }
         }
      ]
   }
}

शब्द स्तर के अन्य प्रकार के प्रश्न भी मौजूद हैं जैसे -

  • Exists query - यदि एक निश्चित क्षेत्र में अशक्त मान है।

  • Missing query - यह क्वेरी मौजूद करने के लिए पूरी तरह से विपरीत है, यह क्वेरी विशिष्ट फ़ील्ड या शून्य मान वाले फ़ील्ड के बिना ऑब्जेक्ट खोजता है।

  • Wildcard or regexp query - यह क्वेरी वस्तुओं में पैटर्न खोजने के लिए नियमित अभिव्यक्तियों का उपयोग करती है।

यौगिक प्रश्न

ये प्रश्न बूलियन ऑपरेटरों जैसे कि और, या, अलग-अलग सूचकांकों के लिए या फ़ंक्शन कॉल आदि का उपयोग करके एक दूसरे के साथ विलय किए गए विभिन्न प्रश्नों का एक संग्रह है।

POST /schools/_search
{
   "query": {
      "bool" : {
         "must" : {
            "term" : { "state" : "UP" }
         },
         "filter": {
            "term" : { "fees" : "2200" }
         },
         "minimum_should_match" : 1,
         "boost" : 1.0
      }
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "took" : 6,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 0,
         "relation" : "eq"
      },
      "max_score" : null,
      "hits" : [ ]
   }
}

जियो क्वेरी

ये क्वेरी जियो लोकेशन और जियो पॉइंट से निपटती है। ये प्रश्न किसी भी स्थान के पास स्कूलों या किसी अन्य भौगोलिक वस्तु का पता लगाने में मदद करते हैं। आपको जियो पॉइंट डेटा प्रकार का उपयोग करने की आवश्यकता है।

PUT /geo_example
{
   "mappings": {
      "properties": {
         "location": {
            "type": "geo_shape"
         }
      }
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{  "acknowledged" : true,
   "shards_acknowledged" : true,
   "index" : "geo_example"
}

अब हम ऊपर बनाए गए इंडेक्स में डेटा पोस्ट करते हैं।

POST /geo_example/_doc?refresh
{
   "name": "Chapter One, London, UK",
   "location": {
      "type": "point",
      "coordinates": [11.660544, 57.800286]
   }
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "took" : 1,
   "timed_out" : false,
   "_shards" : {
      "total" : 1,
      "successful" : 1,
      "skipped" : 0,
      "failed" : 0
   },
   "hits" : {
      "total" : {
         "value" : 2,
         "relation" : "eq"
      },
      "max_score" : 1.0,
      "hits" : [
         "_index" : "geo_example",
         "_type" : "_doc",
         "_id" : "hASWZ2oBbkdGzVfiXHKD",
         "_score" : 1.0,
         "_source" : {
            "name" : "Chapter One, London, UK",
            "location" : {
               "type" : "point",
               "coordinates" : [
                  11.660544,
                  57.800286
               ]
            }
         }
      }
   }

मैपिंग एक सूचकांक में संग्रहीत दस्तावेजों की रूपरेखा है। यह डेटा प्रकार को परिभाषित करता है जैसे कि geo_point या स्ट्रिंग और दस्तावेज़ों और नियमों में मौजूद फ़ील्ड का प्रारूप गतिशील रूप से जोड़े गए फ़ील्ड की मैपिंग को नियंत्रित करने के लिए।

PUT bankaccountdetails
{
   "mappings":{
      "properties":{
         "name": { "type":"text"}, "date":{ "type":"date"},
         "balance":{ "type":"double"}, "liability":{ "type":"double"}
      }
   }
 }

जब हम उपरोक्त कोड चलाते हैं, तो हमें नीचे दी गई प्रतिक्रिया मिलती है -

{
   "acknowledged" : true,
   "shards_acknowledged" : true,
   "index" : "bankaccountdetails"
}

फ़ील्ड डेटा प्रकार

Elasticsearch एक दस्तावेज़ में फ़ील्ड के लिए कई अलग-अलग डेटाटिप्स का समर्थन करता है। इलास्टिसर्च में खेतों को संग्रहीत करने के लिए उपयोग किए जाने वाले डेटा प्रकारों पर यहां विस्तार से चर्चा की गई है।

कोर डेटा प्रकार

ये मूल डेटा प्रकार हैं जैसे कि टेक्स्ट, कीवर्ड, दिनांक, लंबी, डबल, बूलियन या आईपी, जो लगभग सभी प्रणालियों द्वारा समर्थित हैं।

जटिल डेटा प्रकार

ये डेटा प्रकार मुख्य डेटा प्रकारों का एक संयोजन है। इनमें सरणी, JSON ऑब्जेक्ट और नेस्टेड डेटा प्रकार शामिल हैं। नेस्टेड डेटा प्रकार का एक उदाहरण नीचे & minus दिखाया गया है

POST /tabletennis/_doc/1
{
   "group" : "players",
   "user" : [
      {
         "first" : "dave", "last" : "jones"
      },
      {
         "first" : "kevin", "last" : "morris"
      }
   ]
}

जब हम उपरोक्त कोड चलाते हैं, तो हमें नीचे दी गई प्रतिक्रिया मिलती है -

{
   "_index" : "tabletennis",
   "_type" : "_doc",
   "_id" : "1",
   _version" : 2,
   "result" : "updated",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 1,
   "_primary_term" : 1
}

एक अन्य नमूना कोड नीचे दिखाया गया है -

POST /accountdetails/_doc/1
{
   "from_acc":"7056443341", "to_acc":"7032460534",
   "date":"11/1/2016", "amount":10000
}

जब हम उपरोक्त कोड चलाते हैं, तो हमें नीचे दी गई प्रतिक्रिया मिलती है -

{  "_index" : "accountdetails",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 1,
   "_primary_term" : 1
}

हम निम्न कमांड का उपयोग करके उपरोक्त दस्तावेज़ की जांच कर सकते हैं -

GET /accountdetails/_mappings?include_type_name=false

मानचित्रण प्रकारों को हटाना

Elasticsearch 7.0.0 या बाद में बनाए गए सूचकांक अब _default_ मैपिंग को स्वीकार नहीं करते हैं। 6.x में निर्मित सूचकांक एलिटिक्स खोज 6.x में पहले की तरह कार्य करते रहेंगे। 7.0 में एपीआई में प्रकारों को हटा दिया गया है।

जब खोज ऑपरेशन के दौरान किसी क्वेरी को संसाधित किया जाता है, तो विश्लेषण मॉड्यूल द्वारा किसी भी सूचकांक में सामग्री का विश्लेषण किया जाता है। इस मॉड्यूल में विश्लेषक, टोकनधारक, टोकनफिल्टर और चारफिल्टर शामिल हैं। यदि कोई विश्लेषक परिभाषित नहीं है, तो डिफ़ॉल्ट रूप से बिल्ट इन एनालाइज़र, टोकन, फ़िल्टर और टोकन विश्लेषक विश्लेषण मॉड्यूल के साथ पंजीकृत हो जाते हैं।

निम्नलिखित उदाहरण में, हम एक मानक विश्लेषक का उपयोग करते हैं जिसका उपयोग तब किया जाता है जब कोई अन्य विश्लेषक निर्दिष्ट नहीं होता है। यह व्याकरण पर आधारित वाक्य का विश्लेषण करेगा और वाक्य में प्रयुक्त शब्दों का उत्पादन करेगा।

POST _analyze
{
   "analyzer": "standard",
   "text": "Today's weather is beautiful"
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "tokens" : [
      {
         "token" : "today's",
         "start_offset" : 0,
         "end_offset" : 7,
         "type" : "",
         "position" : 0
      },
      {
         "token" : "weather",
         "start_offset" : 8,
         "end_offset" : 15,
         "type" : "",
         "position" : 1
      },
      {
         "token" : "is",
         "start_offset" : 16,
         "end_offset" : 18,
         "type" : "",
         "position" : 2
      },
      {
         "token" : "beautiful",
         "start_offset" : 19,
         "end_offset" : 28,
         "type" : "",
         "position" : 3
      }
   ]
}

मानक विश्लेषक कॉन्फ़िगर करना

हम अपनी कस्टम आवश्यकताओं को प्राप्त करने के लिए विभिन्न मानकों के साथ मानक विश्लेषक को कॉन्फ़िगर कर सकते हैं।

निम्नलिखित उदाहरण में, हम मानक विश्लेषक को 5 के एक max_token_length के लिए कॉन्फ़िगर करते हैं।

इसके लिए, हम पहले विश्लेषक के साथ एक इंडेक्स बनाते हैं जिसमें max_length_token पैरामीटर होता है।

PUT index_4_analysis
{
   "settings": {
      "analysis": {
         "analyzer": {
            "my_english_analyzer": {
               "type": "standard",
               "max_token_length": 5,
               "stopwords": "_english_"
            }
         }
      }
   }
}

आगे हम विश्लेषक को एक पाठ के साथ लागू करते हैं जैसा कि नीचे दिखाया गया है। कृपया ध्यान दें कि टोकन दिखाई नहीं देता है क्योंकि इसमें शुरुआत में दो स्थान और अंत में दो स्थान हैं। शब्द "के लिए" है, इसकी शुरुआत में एक स्थान है और इसके अंत में एक स्थान है। उन सभी को लेते हुए, यह रिक्त स्थान के साथ 4 अक्षर बन जाता है और यह इसे एक शब्द नहीं बनाता है। कम से कम शुरुआत या अंत में एक निरर्थक चरित्र होना चाहिए, जिससे इसे एक शब्द गिना जा सके।

POST index_4_analysis/_analyze
{
   "analyzer": "my_english_analyzer",
   "text": "Today's weather is beautiful"
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "tokens" : [
      {
         "token" : "today",
         "start_offset" : 0,
         "end_offset" : 5,
         "type" : "",
         "position" : 0
      },
      {
         "token" : "s",
         "start_offset" : 6,
         "end_offset" : 7,
         "type" : "",
         "position" : 1
      },
      {
         "token" : "weath",
         "start_offset" : 8,
         "end_offset" : 13,
         "type" : "",
         "position" : 2
      },
      {
         "token" : "er",
         "start_offset" : 13,
         "end_offset" : 15,
         "type" : "",
         "position" : 3
      },
      {
         "token" : "beaut",
         "start_offset" : 19,
         "end_offset" : 24,
         "type" : "",
         "position" : 5
      },
      {
         "token" : "iful",
         "start_offset" : 24,
         "end_offset" : 28,
         "type" : "",
         "position" : 6
      }
   ]
}

विभिन्न विश्लेषक और उनके विवरण की सूची नीचे दी गई तालिका में दी गई है -

S.No विश्लेषक और विवरण
1

Standard analyzer (standard)

इस विश्लेषक के लिए stopwords और max_token_length सेटिंग सेट की जा सकती है। डिफ़ॉल्ट रूप से, स्टॉपवार्ड सूची खाली है और अधिकतम_टोकन_लिफ्ट 255 है।

2

Simple analyzer (simple)

यह विश्लेषक लोअरकेस टोकेनाइज़र से बना है।

3

Whitespace analyzer (whitespace)

यह विश्लेषक व्हॉट्सएप टोकन से बना है।

4

Stop analyzer (stop)

stopwords और stopwords_path को कॉन्फ़िगर किया जा सकता है। डिफ़ॉल्ट रूप से अंग्रेजी स्टॉप शब्दों के लिए प्रारंभिक स्टॉपमार्क और स्टॉप शब्द_पथ में स्टॉप शब्दों के साथ एक पाठ फ़ाइल का पथ होता है।

Tokenizers

टोकनसाइज़र का उपयोग एलिस्टिक्स खोज में एक पाठ से टोकन उत्पन्न करने के लिए किया जाता है। व्हॉट्सएप या अन्य विराम चिह्नों को ध्यान में रखकर पाठ को टोकन में तोड़ा जा सकता है। इलास्टिसर्च में बहुत सारे अंतर्निर्मित टोकन हैं, जिनका उपयोग कस्टम विश्लेषक में किया जा सकता है।

टोकन का एक उदाहरण जो पाठ को ऐसे शब्दों में तोड़ता है जब भी वह एक ऐसे चरित्र का सामना करता है जो एक अक्षर नहीं है, लेकिन यह सभी शर्तों को कम करता है, नीचे दिखाया गया है -

POST _analyze
{
   "tokenizer": "lowercase",
   "text": "It Was a Beautiful Weather 5 Days ago."
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "tokens" : [
      {
         "token" : "it",
         "start_offset" : 0,
         "end_offset" : 2,
         "type" : "word",
         "position" : 0
      },
      {
         "token" : "was",
         "start_offset" : 3,
         "end_offset" : 6,
         "type" : "word",
         "position" : 1
      },
      {
         "token" : "a",
         "start_offset" : 7,
         "end_offset" : 8,
         "type" : "word",
         "position" : 2
      },
      {
         "token" : "beautiful",
         "start_offset" : 9,
         "end_offset" : 18,
         "type" : "word",
         "position" : 3
      },
      {
         "token" : "weather",
         "start_offset" : 19,
         "end_offset" : 26,
         "type" : "word",
         "position" : 4
      },
      {
         "token" : "days",
         "start_offset" : 29,
         "end_offset" : 33,
         "type" : "word",
         "position" : 5
      },
      {
         "token" : "ago",
         "start_offset" : 34,
         "end_offset" : 37,
         "type" : "word",
         "position" : 6
      }
   ]
}

Tokenizers और उनके विवरण की एक सूची नीचे दी गई तालिका में दिखाई गई है -

S.No टोकनर और विवरण
1

Standard tokenizer (standard)

यह व्याकरण आधारित टोकनर पर बनाया गया है और इस टोकन के लिए max_token_length को कॉन्फ़िगर किया जा सकता है।

2

Edge NGram tokenizer (edgeNGram)

इस टोकन के लिए min_gram, max_gram, token_chars जैसी सेटिंग्स सेट की जा सकती हैं।

3

Keyword tokenizer (keyword)

यह पूरे इनपुट को आउटपुट के रूप में उत्पन्न करता है और इसके लिए बफर_साइज़ को सेट किया जा सकता है।

4

Letter tokenizer (letter)

यह पूरे शब्द को तब तक पकड़ता है जब तक कोई गैर-पत्र सामने नहीं आता है।

इलास्टिक्स खोज कई मॉड्यूल से बना है, जो इसकी कार्यक्षमता के लिए जिम्मेदार हैं। इन मॉड्यूल में दो प्रकार की सेटिंग्स हैं -

  • Static Settings- इन सेटिंग्स को Elasticsearch शुरू करने से पहले config (elasticsearch.yml) फ़ाइल में कॉन्फ़िगर करना होगा। आपको इन सेटिंग्स द्वारा परिवर्तनों को प्रतिबिंबित करने के लिए क्लस्टर में सभी चिंता नोड्स को अपडेट करने की आवश्यकता है।

  • Dynamic Settings - ये सेटिंग्स लाइव एलिटिक्स खोज पर सेट की जा सकती हैं।

हम इस अध्याय के निम्नलिखित खंडों में एलियस्टेकिसर्च के विभिन्न मॉड्यूलों पर चर्चा करेंगे।

क्लस्टर-स्तरीय रूटिंग और शारद आवंटन

क्लस्टर स्तर सेटिंग्स विभिन्न नोड्स के लिए शार्क के आवंटन और शार्क के पुनर्संतलन क्लस्टर के पुनः प्राप्ति का निर्णय लेती हैं। शार्क आवंटन को नियंत्रित करने के लिए ये निम्नलिखित सेटिंग्स हैं।

क्लस्टर-स्तरीय शारद आवंटन

स्थापना संभव मान विवरण
cluster.routing.allocation.enable
सब यह डिफ़ॉल्ट मान सभी प्रकार के शार्क के लिए तीव्र आवंटन की अनुमति देता है।
प्राइमरी यह केवल प्राथमिक शार्क के लिए शार्क आवंटन की अनुमति देता है।
new_primaries यह नए सूचकांकों के लिए केवल प्राथमिक शार्क के लिए शार्क आवंटन की अनुमति देता है।
none This does not allow any shard allocations.
cluster.routing.allocation .node_concurrent_recoveries Numeric value (by default 2) This restricts the number of concurrent shard recovery.
cluster.routing.allocation .node_initial_primaries_recoveries Numeric value (by default 4) This restricts the number of parallel initial primary recoveries.
cluster.routing.allocation .same_shard.host Boolean value (by default false) This restricts the allocation of more than one replica of the same shard in the same physical node.
indices.recovery.concurrent _streams Numeric value (by default 3) This controls the number of open network streams per node at the time of shard recovery from peer shards.
indices.recovery.concurrent _small_file_streams Numeric value (by default 2) This controls the number of open streams per node for small files having size less than 5mb at the time of shard recovery.
cluster.routing.rebalance.enable
all This default value allows balancing for all kinds of shards.
primaries This allows shard balancing only for primary shards.
replicas This allows shard balancing only for replica shards.
none This does not allow any kind of shard balancing.
cluster.routing.allocation .allow_rebalance
always This default value always allows rebalancing.
indices_primaries _active This allows rebalancing when all primary shards in cluster are allocated.
Indices_all_active This allows rebalancing when all the primary and replica shards are allocated.
cluster.routing.allocation.cluster _concurrent_rebalance Numeric value (by default 2) This restricts the number of concurrent shard balancing in cluster.
cluster.routing.allocation .balance.shard Float value (by default 0.45f) This defines the weight factor for shards allocated on every node.
cluster.routing.allocation .balance.index Float value (by default 0.55f) This defines the ratio of the number of shards per index allocated on a specific node.
cluster.routing.allocation .balance.threshold Non negative float value (by default 1.0f) This is the minimum optimization value of operations that should be performed.

Disk-based Shard Allocation

Setting Possible value Description
cluster.routing.allocation.disk.threshold_enabled Boolean value (by default true) This enables and disables disk allocation decider.
cluster.routing.allocation.disk.watermark.low String value(by default 85%) This denotes maximum usage of disk; after this point, no other shard can be allocated to that disk.
cluster.routing.allocation.disk.watermark.high String value (by default 90%) This denotes the maximum usage at the time of allocation; if this point is reached at the time of allocation, then Elasticsearch will allocate that shard to another disk.
cluster.info.update.interval String value (by default 30s) This is the interval between disk usages checkups.
cluster.routing.allocation.disk.include_relocations Boolean value (by default true) This decides whether to consider the shards currently being allocated, while calculating disk usage.

Discovery

This module helps a cluster to discover and maintain the state of all the nodes in it. The state of cluster changes when a node is added or deleted from it. The cluster name setting is used to create logical difference between different clusters. There are some modules which help you to use the APIs provided by cloud vendors and those are as given below −

  • Azure discovery
  • EC2 discovery
  • Google compute engine discovery
  • Zen discovery

Gateway

This module maintains the cluster state and the shard data across full cluster restarts. The following are the static settings of this module −

Setting Possible value Description
gateway.expected_nodes numeric value (by default 0) The number of nodes that are expected to be in the cluster for the recovery of local shards.
gateway.expected_master_nodes numeric value (by default 0) The number of master nodes that are expected to be in the cluster before start recovery.
gateway.expected_data_nodes numeric value (by default 0) The number of data nodes expected in the cluster before start recovery.
gateway.recover_after_time String value (by default 5m) This is the interval between disk usages checkups.
cluster.routing.allocation. disk.include_relocations Boolean value (by default true)

This specifies the time for which the recovery process will wait to start regardless of the number of nodes joined in the cluster.

gateway.recover_ after_nodes
gateway.recover_after_master_nodes
gateway.recover_after_data_nodes

HTTP

This module manages the communication between HTTP client and Elasticsearch APIs. This module can be disabled by changing the value of http.enabled to false.

The following are the settings (configured in elasticsearch.yml) to control this module −

S.No Setting & Description
1

http.port

This is a port to access Elasticsearch and it ranges from 9200-9300.

2

http.publish_port

This port is for http clients and is also useful in case of firewall.

3

http.bind_host

This is a host address for http service.

4

http.publish_host

This is a host address for http client.

5

http.max_content_length

This is the maximum size of content in an http request. Its default value is 100mb.

6

http.max_initial_line_length

This is the maximum size of URL and its default value is 4kb.

7

http.max_header_size

This is the maximum http header size and its default value is 8kb.

8

http.compression

This enables or disables support for compression and its default value is false.

9

http.pipelinig

This enables or disables HTTP pipelining.

10

http.pipelining.max_events

This restricts the number of events to be queued before closing an HTTP request.

Indices

This module maintains the settings, which are set globally for every index. The following settings are mainly related to memory usage −

Circuit Breaker

This is used for preventing operation from causing an OutOfMemroyError. The setting mainly restricts the JVM heap size. For example, indices.breaker.total.limit setting, which defaults to 70% of JVM heap.

Fielddata Cache

This is used mainly when aggregating on a field. It is recommended to have enough memory to allocate it. The amount of memory used for the field data cache can be controlled using indices.fielddata.cache.size setting.

Node Query Cache

This memory is used for caching the query results. This cache uses Least Recently Used (LRU) eviction policy. Indices.queries.cahce.size setting controls the memory size of this cache.

Indexing Buffer

This buffer stores the newly created documents in the index and flushes them when the buffer is full. Setting like indices.memory.index_buffer_size control the amount of heap allocated for this buffer.

Shard Request Cache

This cache is used to store the local search data for every shard. Cache can be enabled during the creation of index or can be disabled by sending URL parameter.

Disable cache - ?request_cache = true
Enable cache "index.requests.cache.enable": true

Indices Recovery

It controls the resources during recovery process. The following are the settings −

Setting Default value
indices.recovery.concurrent_streams 3
indices.recovery.concurrent_small_file_streams 2
indices.recovery.file_chunk_size 512kb
indices.recovery.translog_ops 1000
indices.recovery.translog_size 512kb
indices.recovery.compress true
indices.recovery.max_bytes_per_sec 40mb

TTL Interval

Time to Live (TTL) interval defines the time of a document, after which the document gets deleted. The following are the dynamic settings for controlling this process −

Setting Default value
indices.ttl.interval 60s
indices.ttl.bulk_size 1000

Node

Each node has an option to be data node or not. You can change this property by changing node.data setting. Setting the value as false defines that the node is not a data node.

These are the modules which are created for every index and control the settings and behaviour of the indices. For example, how many shards an index can use or the number of replicas a primary shard can have for that index etc. There are two types of index settings −

  • Static − These can be set only at index creation time or on a closed index.
  • Dynamic − These can be changed on a live index.

Static Index Settings

The following table shows the list of static index settings −

Setting Possible value Description
index.number_of_shards Defaults to 5, Maximum 1024 The number of primary shards that an index should have.
index.shard.check_on_startup Defaults to false. Can be True Whether or not shards should be checked for corruption before opening.
index.codec LZ4 compression. Type of compression used to store data.
index.routing_partition_size 1 The number of shards a custom routing value can go to.
index.load_fixed_bitset_filters_eagerly false Indicates whether cached filters are pre-loaded for nested queries

Dynamic Index Settings

The following table shows the list of dynamic index settings −

Setting Possible value Description
index.number_of_replicas Defaults to 1 The number of replicas each primary shard has.
index.auto_expand_replicas A dash delimited lower and upper bound (0-5) Auto-expand the number of replicas based on the number of data nodes in the cluster.
index.search.idle.after 30seconds How long a shard cannot receive a search or get request until it’s considered search idle.
index.refresh_interval 1 second How often to perform a refresh operation, which makes recent changes to the index visible to search.
index.blocks.read_only 1 सच / झूठ इंडेक्स और इंडेक्स मेटाडेटा को केवल पढ़ने के लिए सही पर सेट करें, लिखने और मेटाडेटा परिवर्तन की अनुमति देने के लिए गलत।

कभी-कभी हमें इसे इंडेक्स करने से पहले एक डॉक्यूमेंट को बदलना पड़ता है। उदाहरण के लिए, हम किसी फ़ील्ड को दस्तावेज़ से निकालना चाहते हैं या किसी फ़ील्ड का नाम बदलना और फिर उसे अनुक्रमित करना चाहते हैं। इसे Ingest नोड द्वारा नियंत्रित किया जाता है।

क्लस्टर में प्रत्येक नोड में निगलना करने की क्षमता है लेकिन इसे केवल विशिष्ट नोड्स द्वारा संसाधित किए जाने के लिए अनुकूलित किया जा सकता है।

कदम शामिल किए गए

निगलना नोड के काम में दो चरण शामिल हैं -

  • एक पाइपलाइन बनाना
  • एक डॉक्टर बनाना

एक पाइपलाइन बनाएँ

पहले एक पाइपलाइन बनाना जिसमें प्रोसेसर शामिल हैं और फिर पाइपलाइन निष्पादित करना, जैसा कि नीचे दिखाया गया है -

PUT _ingest/pipeline/int-converter
{
   "description": "converts the content of the seq field to an integer",
   "processors" : [
      {
         "convert" : {
            "field" : "seq",
            "type": "integer"
         }
      }
   ]
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "acknowledged" : true
}

एक डॉक्टर बनाएँ

आगे हम पाइपलाइन कनवर्टर का उपयोग करके एक दस्तावेज़ बनाते हैं।

PUT /logs/_doc/1?pipeline=int-converter
{
   "seq":"21",
   "name":"Tutorialspoint",
   "Addrs":"Hyderabad"
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "_index" : "logs",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 0,
   "_primary_term" : 1
}

अगला हम नीचे दिए गए GET कमांड का उपयोग करके ऊपर बनाए गए डॉक्टर की खोज करते हैं -

GET /logs/_doc/1

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "logs",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "_seq_no" : 0,
   "_primary_term" : 1,
   "found" : true,
   "_source" : {
      "Addrs" : "Hyderabad",
      "name" : "Tutorialspoint",
      "seq" : 21
   }
}

आप ऊपर देख सकते हैं कि 21 पूर्णांक बन गया है।

बिना पाइपलाइन के

अब हम पाइपलाइन का उपयोग किए बिना एक दस्तावेज़ बनाते हैं।

PUT /logs/_doc/2
{
   "seq":"11",
   "name":"Tutorix",
   "Addrs":"Secunderabad"
}
GET /logs/_doc/2

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "logs",
   "_type" : "_doc",
   "_id" : "2",
   "_version" : 1,
   "_seq_no" : 1,
   "_primary_term" : 1,
   "found" : true,
   "_source" : {
      "seq" : "11",
      "name" : "Tutorix",
      "Addrs" : "Secunderabad"
   }
}

आप ऊपर देख सकते हैं कि 11 एक स्ट्रिंग है जिसका उपयोग पाइपलाइन के बिना किया जा रहा है।

सूचकांक जीवन चक्र के प्रबंधन में शार्क के आकार और प्रदर्शन आवश्यकताओं जैसे कारकों के आधार पर प्रबंधन क्रियाएं करना शामिल है। सूचकांक जीवनचक्र प्रबंधन (ILM) एपीआई आपको स्वचालित करने में सक्षम बनाता है कि आप समय के साथ अपने सूचकांकों का प्रबंधन कैसे करना चाहते हैं।

यह अध्याय ILM API और उनके उपयोग की एक सूची देता है।

नीति प्रबंधन एपीआई

एपीआई का नाम उद्देश्य उदाहरण
जीवनचक्र नीति बनाएँ। एक जीवनचक्र नीति बनाता है। यदि निर्दिष्ट नीति मौजूद है, तो नीति को बदल दिया जाता है और नीति संस्करण बढ़ा दिया जाता है। PUT_ilm / नीति / policy_id
जीवनचक्र नीति प्राप्त करें। निर्दिष्ट नीति परिभाषा देता है। पॉलिसी संस्करण और अंतिम संशोधित तिथि शामिल है। यदि कोई नीति निर्दिष्ट नहीं है, तो सभी परिभाषित नीतियां लौटाता है। GET_ilm / नीति / policy_id
जीवनचक्र नीति हटाएं निर्दिष्ट जीवनचक्र नीति परिभाषा को हटाता है। आप वर्तमान में उपयोग में आने वाली नीतियों को हटा नहीं सकते। यदि किसी भी सूचक को प्रबंधित करने के लिए नीति का उपयोग किया जा रहा है, तो अनुरोध विफल हो जाता है और एक त्रुटि देता है। DELETE_ilm / नीति / policy_id

सूचकांक प्रबंधन एपीआई

एपीआई का नाम उद्देश्य उदाहरण
जीवनचक्र चरण API पर जाएं। मैन्युअल रूप से निर्दिष्ट चरण में एक इंडेक्स चलता है और उस चरण को निष्पादित करता है। POST_ilm / स्थानांतरित / सूचकांक
पुन: नीति। नीति को उस चरण पर सेट करता है जहां त्रुटि हुई थी और कदम को निष्पादित करता है। POST इंडेक्स / _ilm / रिट्री
इंडेक्स एपीआई एडिट से पॉलिसी निकालें। निर्दिष्ट जीवनचक्र नीति को हटा देता है और निर्दिष्ट सूचकांक का प्रबंधन बंद कर देता है। यदि एक इंडेक्स पैटर्न निर्दिष्ट किया जाता है, तो सभी मिलान किए गए सूचकांकों से निर्दिष्ट नीतियों को हटा देता है। पोस्ट इंडेक्स / _ilm / निकालें

ऑपरेशन प्रबंधन एपीआई

एपीआई का नाम उद्देश्य उदाहरण
सूचकांक जीवनचक्र प्रबंधन स्थिति API प्राप्त करें। ILM प्लगइन की स्थिति देता है। प्रतिक्रिया में Operation_mode फ़ील्ड तीन अवस्थाओं में से एक दिखाती है: STARTED, STOPPING, या STOPPED। GET / _ilm / स्थिति
सूचकांक जीवन चक्र प्रबंधन एपीआई शुरू करें। यदि वर्तमान में रोका गया है तो ILM प्लगइन प्रारंभ करता है। क्लस्टर बनने पर ILM अपने आप शुरू हो जाता है। POST / _ilm / start
सूचकांक जीवन चक्र प्रबंधन एपीआई बंद करो। सभी जीवनचक्र प्रबंधन कार्यों को रोकती है और ILM प्लगइन को रोकती है। यह तब उपयोगी होता है जब आप क्लस्टर पर रखरखाव कर रहे होते हैं और अपने सूचकांकों पर ILM को किसी भी कार्य करने से रोकने की आवश्यकता होती है। POST / _ilm / रोक
जीवनचक्र एपीआई की व्याख्या करें। सूचकांक के वर्तमान जीवन चक्र की स्थिति के बारे में जानकारी प्राप्त करता है, जैसे कि वर्तमान में निष्पादित चरण, कार्रवाई और कदम। दिखाता है जब सूचकांक हर एक में प्रवेश करता है, चल रहे चरण की परिभाषा, और किसी भी विफलता के बारे में जानकारी। सूचकांक / _ilm / समझाएं

यह एक घटक है जो एलिस्टिक्स खोज के खिलाफ वास्तविक समय में एसक्यूएल जैसे प्रश्नों को निष्पादित करने की अनुमति देता है। आप एलिस्टिक्स खोज एसक्यूएल को एक अनुवादक के रूप में सोच सकते हैं, जो एसक्यूएल और एलिस्टिक्स दोनों को समझता है और एलिटैसर्च की क्षमताओं का लाभ उठाकर वास्तविक समय में डेटा को पढ़ना और संसाधित करना आसान बनाता है।

एलेस्टिक्स खोज एसक्यूएल के लाभ

  • It has native integration - प्रत्येक और प्रत्येक क्वेरी को अंतर्निहित भंडारण के अनुसार प्रासंगिक नोड्स के खिलाफ कुशलतापूर्वक निष्पादित किया जाता है।

  • No external parts - Elasticsearch क्वेरी करने के लिए अतिरिक्त हार्डवेयर, प्रक्रिया, रनटाइम या लाइब्रेरी की कोई आवश्यकता नहीं है।

  • Lightweight and efficient - यह वास्तविक समय में उचित पूर्ण-पाठ खोज की अनुमति देने के लिए SQL को गले लगाता है और उजागर करता है।

उदाहरण

PUT /schoollist/_bulk?refresh
   {"index":{"_id": "CBSE"}}
   {"name": "GleanDale", "Address": "JR. Court Lane", "start_date": "2011-06-02",
   "student_count": 561}
   {"index":{"_id": "ICSE"}}
   {"name": "Top-Notch", "Address": "Gachibowli Main Road", "start_date": "1989-
   05-26", "student_count": 482}
   {"index":{"_id": "State Board"}}
   {"name": "Sunshine", "Address": "Main Street", "start_date": "1965-06-01",
   "student_count": 604}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

{
   "took" : 277,
   "errors" : false,
   "items" : [
      {
         "index" : {
            "_index" : "schoollist",
            "_type" : "_doc",
            "_id" : "CBSE",
            "_version" : 1,
            "result" : "created",
            "forced_refresh" : true,
            "_shards" : {
               "total" : 2,
               "successful" : 1,
               "failed" : 0
            },
            "_seq_no" : 0,
            "_primary_term" : 1,
            "status" : 201
         }
      },
      {
         "index" : {
            "_index" : "schoollist",
            "_type" : "_doc",
            "_id" : "ICSE",
            "_version" : 1,
            "result" : "created",
            "forced_refresh" : true,
            "_shards" : {
               "total" : 2,
               "successful" : 1,
               "failed" : 0
            },
            "_seq_no" : 1,
            "_primary_term" : 1,
            "status" : 201
         }
      },
      {
         "index" : {
            "_index" : "schoollist",
            "_type" : "_doc",
            "_id" : "State Board",
            "_version" : 1,
            "result" : "created",
            "forced_refresh" : true,
            "_shards" : {
               "total" : 2,
               "successful" : 1,
               "failed" : 0
            },
            "_seq_no" : 2,
            "_primary_term" : 1,
            "status" : 201
         }
      }
   ]
}

एसक्यूएल क्वेरी

निम्न उदाहरण दिखाता है कि हम SQL क्वेरी को कैसे फ्रेम करते हैं -

POST /_sql?format=txt
{
   "query": "SELECT * FROM schoollist WHERE start_date < '2000-01-01'"
}

उपरोक्त कोड चलाने पर, हमें नीचे दिखाए अनुसार प्रतिक्रिया मिलती है -

Address             | name          | start_date             | student_count
--------------------+---------------+------------------------+---------------
Gachibowli Main Road|Top-Notch      |1989-05-26T00:00:00.000Z|482
Main Street         |Sunshine       |1965-06-01T00:00:00.000Z|604

Note - उपरोक्त SQL क्वेरी को बदलकर, आप विभिन्न परिणाम सेट प्राप्त कर सकते हैं।

क्लस्टर के स्वास्थ्य की निगरानी के लिए, निगरानी सुविधा प्रत्येक नोड से मैट्रिक्स एकत्र करती है और उन्हें एलियस्टिक्स खोज सूचक में संग्रहीत करती है। Elasticsearch में निगरानी से जुड़ी सभी सेटिंग्स को प्रत्येक नोड के लिए elasticsearch.yml फ़ाइल में या जहाँ संभव हो, डायनामिक क्लस्टर सेटिंग्स में सेट किया जाना चाहिए।

निगरानी शुरू करने के लिए, हमें क्लस्टर सेटिंग्स की जाँच करने की आवश्यकता है, जिसे निम्न तरीके से किया जा सकता है -

GET _cluster/settings
{
   "persistent" : { },
   "transient" : { }
}

स्टैक में प्रत्येक घटक स्वयं की निगरानी के लिए जिम्मेदार है और फिर उन दस्तावेजों को राउटिंग और इंडेक्सिंग (भंडारण) दोनों के लिए एलिस्टिक्स खोज उत्पादन क्लस्टर में अग्रेषित करता है। इलास्टिक्स में राउटिंग और इंडेक्सिंग प्रक्रियाओं को कलेक्टरों और निर्यातकों द्वारा नियंत्रित किया जाता है।

कलेक्टरों

कलेक्टर एलिस्टिक्स खोज में सार्वजनिक एपीआई से डेटा प्राप्त करने के लिए प्रत्येक संग्रह अंतराल के अनुसार एक बार चलता है जिसे वह मॉनिटर करना चुनता है। जब डेटा संग्रह समाप्त हो जाता है, तो डेटा थोक में निर्यातकों को मॉनिटरिंग क्लस्टर में भेजा जाता है।

प्रति डेटा प्रकार केवल एक कलेक्टर इकट्ठा है। प्रत्येक कलेक्टर शून्य या अधिक निगरानी दस्तावेज बना सकता है।

निर्यातकों

निर्यातक किसी भी इलास्टिक स्टैक स्रोत से एकत्र किए गए डेटा को लेते हैं और इसे निगरानी क्लस्टर में भेजते हैं। एक से अधिक निर्यातक को कॉन्फ़िगर करना संभव है, लेकिन सामान्य और डिफ़ॉल्ट सेटअप एकल निर्यातक का उपयोग करना है। एक्सपोर्टर्स नोड और क्लस्टर दोनों स्तरों पर कॉन्फ़िगर करने योग्य हैं।

एलियटसर्च में दो प्रकार के निर्यातक हैं -

  • local - यह निर्यातक डेटा को एक ही क्लस्टर में वापस करता है

  • http - पसंदीदा निर्यातक, जिसका उपयोग आप डेटा को HTTP के माध्यम से सुलभ किसी भी समर्थित Elasticsearch क्लस्टर में कर सकते हैं।

इससे पहले कि निर्यातकों डेटा की निगरानी कर सकें, उन्हें कुछ एलिटिक्स खोज संसाधन स्थापित करने होंगे। इन संसाधनों में टेम्पलेट और निगलना पाइपलाइन शामिल हैं

रोलअप कार्य एक आवधिक कार्य है जो सूचकांक पैटर्न द्वारा निर्दिष्ट सूचकांक से डेटा को सारांशित करता है और इसे एक नए सूचकांक में रोल करता है। निम्नलिखित उदाहरण में, हम अलग-अलग दिनांक समय टिकटों के साथ एक इंडेक्स नाम का सेंसर बनाते हैं। फिर हम समय-समय पर क्रोन जॉब का उपयोग करके इन सूचकांकों से डेटा रोलअप करने के लिए रोलअप जॉब बनाते हैं।

PUT /sensor/_doc/1
{
   "timestamp": 1516729294000,
   "temperature": 200,
   "voltage": 5.2,
   "node": "a"
}

उपरोक्त कोड चलाने पर, हमें निम्नलिखित परिणाम मिलते हैं -

{
   "_index" : "sensor",
   "_type" : "_doc",
   "_id" : "1",
   "_version" : 1,
   "result" : "created",
   "_shards" : {
      "total" : 2,
      "successful" : 1,
      "failed" : 0
   },
   "_seq_no" : 0,
   "_primary_term" : 1
}

अब, दूसरे दस्तावेज़ और इसी तरह अन्य दस्तावेज़ों के लिए भी जोड़ें।

PUT /sensor-2018-01-01/_doc/2
{
   "timestamp": 1413729294000,
   "temperature": 201,
   "voltage": 5.9,
   "node": "a"
}

एक रोलअप जॉब बनाएं

PUT _rollup/job/sensor
{
   "index_pattern": "sensor-*",
   "rollup_index": "sensor_rollup",
   "cron": "*/30 * * * * ?",
   "page_size" :1000,
   "groups" : {
      "date_histogram": {
         "field": "timestamp",
         "interval": "60m"
      },
      "terms": {
         "fields": ["node"]
      }
   },
   "metrics": [
      {
         "field": "temperature",
         "metrics": ["min", "max", "sum"]
      },
      {
         "field": "voltage",
         "metrics": ["avg"]
      }
   ]
}

क्रोन पैरामीटर यह नियंत्रित करता है कि नौकरी कब और कितनी बार सक्रिय होती है। जब रोलअप जॉब का क्रोन शेड्यूल ट्रिगर हो जाता है, तो यह अंतिम सक्रियण के बाद इसे छोड़ देना शुरू कर देगा

नौकरी चलाने और कुछ डेटा संसाधित करने के बाद, हम कुछ खोज करने के लिए DSL क्वेरी का उपयोग कर सकते हैं।

GET /sensor_rollup/_rollup_search
{
   "size": 0,
   "aggregations": {
      "max_temperature": {
         "max": {
            "field": "temperature"
         }
      }
   }
}

अक्सर खोजे जाने वाले सूचकांकों को स्मृति में रखा जाता है क्योंकि उन्हें फिर से बनाने और कुशल खोज में मदद करने में समय लगता है। दूसरी ओर, ऐसे संकेत हो सकते हैं, जिन पर हम शायद ही कभी पहुंच पाते हैं। उन सूचकांकों को मेमोरी पर कब्जा करने की आवश्यकता नहीं होती है और जब उन्हें जरूरत होती है, तब दोबारा बनाया जा सकता है। इस तरह के सूचकांकों को जमे हुए सूचक के रूप में जाना जाता है।

इलास्टिक्स खोज हर बार जमे हुए सूचकांक के प्रत्येक शार्क के क्षणिक डेटा संरचनाओं का निर्माण करती है जो कि खोजा जाता है और खोज पूरा होते ही इन डेटा संरचनाओं को छोड़ देता है। क्योंकि एलिटिक्स खोज इन क्षणिक डेटा संरचनाओं को स्मृति में बनाए नहीं रखती है, जमे हुए सूचकांक सामान्य सूचकांकों की तुलना में बहुत कम हीप का उपभोग करते हैं। यह अन्यथा की तुलना में बहुत अधिक डिस्क-टू-हीप अनुपात के लिए अनुमति देता है।

फ्रीजिंग और अनफ्रीजिंग के लिए उदाहरण

निम्नलिखित उदाहरण एक इंडेक्स को जमा और मुक्त करता है -

POST /index_name/_freeze
POST /index_name/_unfreeze

जमे हुए सूचकांकों पर खोजों को धीरे-धीरे निष्पादित करने की उम्मीद है। जमे हुए सूचकांक उच्च खोज भार के लिए अभिप्रेत नहीं हैं। यह संभव है कि जमे हुए सूचकांक की खोज को पूरा करने में कुछ सेकंड या मिनट लग सकते हैं, भले ही वही खोजें मिलीसेकंड में पूरी हो जाएं जब सूचकांक जमे हुए नहीं थे।

एक जमे हुए सूचकांक की खोज

प्रति नोड समवर्ती लोड किए गए सूचकांकों की संख्या खोज_थ्रूटल थ्रेडपूल में थ्रेड्स की संख्या द्वारा सीमित है, जो डिफ़ॉल्ट रूप से 1 है। जमे हुए सूचकांकों को शामिल करने के लिए, एक खोज अनुरोध क्वेरी पैरामीटर के साथ निष्पादित किया जाना चाहिए - ign_throttled = false।

GET /index_name/_search?q=user:tpoint&ignore_throttled=false

जमे हुए सूचकांकों की निगरानी करना

जमे हुए सूचकांक साधारण सूचकांक हैं जो खोज थ्रॉटलिंग और एक मेमोरी कुशल शार्क कार्यान्वयन का उपयोग करते हैं।

GET /_cat/indices/index_name?v&h=i,sth

इलास्टिक्स खोज एक जार फ़ाइल प्रदान करता है, जिसे किसी भी जावा आईडीई में जोड़ा जा सकता है और इसका उपयोग कोड का परीक्षण करने के लिए किया जा सकता है जो एलिटिक्सखोज से संबंधित है। इलास्टिसर्च द्वारा प्रदान की गई रूपरेखा का उपयोग करके परीक्षणों की एक श्रृंखला का प्रदर्शन किया जा सकता है। इस अध्याय में, हम इन परीक्षणों पर विस्तार से चर्चा करेंगे -

  • इकाई का परीक्षण
  • एकीकरण जांच
  • यादृच्छिक परीक्षण

आवश्यक शर्तें

परीक्षण के साथ शुरू करने के लिए, आपको अपने कार्यक्रम के लिए एलेस्टिक्स खोज परीक्षण निर्भरता को जोड़ना होगा। आप इस उद्देश्य के लिए मावेन का उपयोग कर सकते हैं और pom.xml में निम्नलिखित जोड़ सकते हैं।

<dependency>
   <groupId>org.elasticsearch</groupId>
   <artifactId>elasticsearch</artifactId>
   <version>2.1.0</version>
</dependency>

एस्सेटअप को शुरू किया गया है ताकि एलिस्टिक्स खोज नोड को शुरू करने और रोकने के लिए और सूचकांक भी बनाया जा सके।

EsSetup esSetup = new EsSetup();

esSetup.execute () फ़ंक्शन के साथ createIndex इंडेक्स बनाएगा, आपको सेटिंग्स, प्रकार और डेटा निर्दिष्ट करने की आवश्यकता है।

इकाई का परीक्षण

यूनिट टेस्ट JUnit और Elasticsearch परीक्षण ढांचे का उपयोग करके किया जाता है। एलियोडेस खोज कक्षाओं का उपयोग करके नोड और सूचकांक बनाए जा सकते हैं और परीक्षण करने के लिए परीक्षण विधि का उपयोग किया जा सकता है। इस परीक्षण के लिए ESTestCase और ESTokenStreamTestCase कक्षाओं का उपयोग किया जाता है।

एकीकरण जांच

एकीकरण परीक्षण एक क्लस्टर में कई नोड्स का उपयोग करता है। इस परीक्षण के लिए ESIntegTestCase क्लास का उपयोग किया जाता है। विभिन्न तरीके हैं जो टेस्ट केस तैयार करने का काम आसान बनाते हैं।

S.No विधि और विवरण
1

refresh()

एक क्लस्टर में सभी सूचकांक ताज़ा हैं

2

ensureGreen()

हरित स्वास्थ्य क्लस्टर राज्य सुनिश्चित करता है

3

ensureYellow()

एक पीला स्वास्थ्य क्लस्टर राज्य सुनिश्चित करता है

4

createIndex(name)

इस विधि को दिए गए नाम के साथ इंडेक्स बनाएं

5

flush()

क्लस्टर के सभी सूचकांक फ्लश हो गए हैं

6

flushAndRefresh()

फ्लश () और ताज़ा ()

7

indexExists(name)

निर्दिष्ट सूचकांक के अस्तित्व की पुष्टि करता है

8

clusterService()

क्लस्टर सेवा जावा वर्ग देता है

9

cluster()

परीक्षण क्लस्टर वर्ग देता है

टेस्ट क्लस्टर तरीके

S.No विधि और विवरण
1

ensureAtLeastNumNodes(n)

निर्दिष्ट क्लस्टर में नोड्स की न्यूनतम संख्या निर्दिष्ट संख्या से अधिक या बराबर है।

2

ensureAtMostNumNodes(n)

निर्दिष्ट क्लस्टर में अधिकतम नोड्स की संख्या निर्दिष्ट संख्या से कम या बराबर है।

3

stopRandomNode()

एक क्लस्टर में एक यादृच्छिक नोड को रोकने के लिए

4

stopCurrentMasterNode()

मास्टर नोड को रोकने के लिए

5

stopRandomNonMaster()

एक क्लस्टर में एक यादृच्छिक नोड को रोकने के लिए, जो मास्टर नोड नहीं है।

6

buildNode()

एक नया नोड बनाएं

7

startNode(settings)

एक नया नोड शुरू करें

8

nodeSettings()

नोड सेटिंग बदलने के लिए इस विधि को ओवरराइड करें।

ग्राहकों तक पहुंच

एक क्लाइंट का उपयोग क्लस्टर में विभिन्न नोड्स तक पहुंचने और कुछ कार्रवाई करने के लिए किया जाता है। रैंडम क्लाइंट पाने के लिए ESIntegTestCase.client () विधि का उपयोग किया जाता है। Elasticsearch क्लाइंट को एक्सेस करने के लिए अन्य तरीके भी प्रदान करता है और उन तरीकों को ESIntegTestCase.internalCluster () विधि का उपयोग करके एक्सेस किया जा सकता है।

S.No विधि और विवरण
1

iterator()

यह आपको सभी उपलब्ध क्लाइंट तक पहुंचने में मदद करता है।

2

masterClient()

यह एक क्लाइंट देता है, जो मास्टर नोड के साथ संचार कर रहा है।

3

nonMasterClient()

यह एक क्लाइंट देता है, जो मास्टर नोड के साथ संचार नहीं कर रहा है।

4

clientNodeClient()

यह वर्तमान में क्लाइंट नोड पर एक क्लाइंट देता है।

यादृच्छिक परीक्षण

इस परीक्षण का उपयोग उपयोगकर्ता के हर संभावित डेटा के कोड का परीक्षण करने के लिए किया जाता है, ताकि भविष्य में किसी भी प्रकार के डेटा के साथ कोई विफलता न हो। इस परीक्षण को करने के लिए रैंडम डेटा सबसे अच्छा विकल्प है।

रैंडम डेटा उत्पन्न करना

इस परीक्षण में, रैंडम क्लास को रैंडमाइंडटेस्ट द्वारा उपलब्ध कराए गए इंस्टेंट द्वारा त्वरित किया जाता है और विभिन्न प्रकार के डेटा प्राप्त करने के लिए कई तरीके प्रदान करता है।

तरीका प्रतिलाभ की मात्रा
getRandom () यादृच्छिक वर्ग का उदाहरण
randomBoolean () बेतरतीब बूलियन
randomByte () रैंडम बाइट
randomShort () यादृच्छिक छोटा
randomInt () रैंडम पूर्णांक
randomLong () यादृच्छिक लंबे
randomFloat () रैंडम फ्लोट
randomDouble () यादृच्छिक डबल
randomLocale () बेतरतीब लोकेल
randomTimeZone () यादृच्छिक समय क्षेत्र
randomFrom () सरणी से यादृच्छिक तत्व

इस प्रकार के दावे

इलास्टिसर्चोरसेरेसियन और एलियस्टेकेरेक्टगियोसॉर्सियन क्लासेस में दावे होते हैं, जिनका उपयोग परीक्षण के समय कुछ सामान्य जाँच करने के लिए किया जाता है। उदाहरण के लिए, यहां दिए गए कोड को देखें -

SearchResponse seearchResponse = client().prepareSearch();
assertHitCount(searchResponse, 6);
assertFirstHit(searchResponse, hasId("6"));
assertSearchHits(searchResponse, "1", "2", "3", "4",”5”,”6”);

एक किबाना डैशबोर्ड विज़ुअलाइज़ेशन और खोजों का एक संग्रह है। आप डैशबोर्ड सामग्री को व्यवस्थित, आकार और संपादित कर सकते हैं और फिर डैशबोर्ड को सहेज सकते हैं ताकि आप इसे साझा कर सकें। इस अध्याय में, हम देखेंगे कि डैशबोर्ड कैसे बनाया और संपादित किया जाए।

डैशबोर्ड निर्माण

किबाना होमपेज से, नीचे दिखाए गए अनुसार बार नियंत्रण बार से डैशबोर्ड विकल्प चुनें। यह आपको एक नया डैशबोर्ड बनाने के लिए संकेत देगा।

डैशबोर्ड में विज़ुअलाइज़ेशन जोड़ने के लिए, हम मेनू जोड़ें और पहले से उपलब्ध विज़ुअलाइज़ेशन से चयन चुनें। हमने सूची से निम्नलिखित विज़ुअलाइज़ेशन विकल्प चुने।

उपरोक्त विज़ुअलाइज़ेशन का चयन करने पर, हमें यहां दिखाए गए अनुसार डैशबोर्ड मिलता है। हम बाद में तत्वों को बदलने और नए तत्वों को जोड़ने के लिए डैशबोर्ड को जोड़ और संपादित कर सकते हैं।

निरीक्षण करने वाले तत्व

हम विज़ुअलाइज़ेशन पैनल मेनू का चयन करके और डैशबोर्ड तत्वों का निरीक्षण कर सकते हैं Inspect। यह तत्व के पीछे डेटा को बाहर लाएगा जिसे डाउनलोड भी किया जा सकता है।

डैशबोर्ड साझा करना

हम डैशबोर्ड को साझा मेनू चुनकर और नीचे दिखाए गए अनुसार हाइपरलिंक प्राप्त करने के लिए विकल्प चुन सकते हैं -

किबाना होम पेज में उपलब्ध खोज कार्यक्षमता हमें विभिन्न कोणों से डेटा सेट का पता लगाने की अनुमति देती है। आप चयनित सूचकांक पैटर्न के लिए डेटा खोज और फ़िल्टर कर सकते हैं। डेटा आमतौर पर समय की अवधि में मूल्यों के वितरण के रूप में उपलब्ध है।

ईकॉमर्स डेटा सैंपल का पता लगाने के लिए, हम पर क्लिक करते हैं Discoverनीचे चित्र में दिखाया गया है। यह चार्ट के साथ डेटा को लाएगा।

समयानुसार छानना

विशिष्ट समय अंतराल द्वारा डेटा को फ़िल्टर करने के लिए हम नीचे दिखाए गए समय फिल्टर विकल्प का उपयोग करते हैं। डिफ़ॉल्ट रूप से, फ़िल्टर 15 मिनट पर सेट किया गया है।

फील्ड्स द्वारा फ़िल्टरिंग

डेटा सेट का उपयोग करके फ़ील्ड्स को फ़िल्टर भी किया जा सकता है Add Filterविकल्प के रूप में नीचे दिखाया गया है। यहां हम एक या अधिक फ़ील्ड जोड़ते हैं और फ़िल्टर लागू होने के बाद संबंधित परिणाम प्राप्त करते हैं। हमारे उदाहरण में हम क्षेत्र चुनते हैंday_of_week और फिर उस क्षेत्र के लिए ऑपरेटर के रूप में is और मान Sunday

अगला, हम ऊपर दिए गए फ़िल्टर शर्तों के साथ सहेजें पर क्लिक करते हैं। फ़िल्टर लागू शर्तों के परिणाम सेट को नीचे दिखाया गया है।

डेटा टेबल एक प्रकार का विज़ुअलाइज़ेशन है जिसका उपयोग किसी संयोजित एकत्रीकरण के कच्चे डेटा को प्रदर्शित करने के लिए किया जाता है। डेटा टेबल का उपयोग करके विभिन्न प्रकार के एकत्रीकरण प्रस्तुत किए जाते हैं। डेटा टेबल बनाने के लिए, हमें उन चरणों से गुजरना चाहिए, जिनके बारे में यहां विस्तार से चर्चा की गई है।

कल्पना

किबाना होम स्क्रीन में हमें विकल्प नाम विज़ुअलाइज़ मिलता है जो हमें एलिटोसर्च में संग्रहीत सूचकांकों से विज़ुअलाइज़ेशन और एकत्रीकरण बनाने की अनुमति देता है। निम्न छवि विकल्प दिखाती है।

डेटा टेबल का चयन करें

अगला, हम उपलब्ध विभिन्न विज़ुअलाइज़ेशन विकल्पों में से डेटा टेबल विकल्प का चयन करते हैं। विकल्प निम्नलिखित छवि में दिखाया गया है & miuns;

मैट्रिक्स का चयन करें

हम तब डेटा तालिका विज़ुअलाइज़ेशन बनाने के लिए आवश्यक मीट्रिक का चयन करते हैं। यह विकल्प यह तय करता है कि हम किस प्रकार के एकत्रीकरण का उपयोग करने जा रहे हैं। हम इसके लिए निर्धारित ईकॉमर्स डेटा से नीचे दिखाए गए विशिष्ट क्षेत्रों का चयन करते हैं।

डेटा टेबल के लिए उपर्युक्त विन्यास को चलाने पर, हमें यहाँ चित्र के अनुसार परिणाम मिलता है -

क्षेत्रीय मानचित्र भौगोलिक मानचित्र पर मीट्रिक दिखाते हैं। यह अलग-अलग भौगोलिक क्षेत्रों में अलग-अलग तीव्रता के साथ लंगर डाले गए डेटा को देखने में उपयोगी है। गहरे रंग के शेड आमतौर पर उच्च मूल्यों को दर्शाते हैं और लाइटर शेड्स कम मूल्यों को दर्शाते हैं।

इस विज़ुअलाइज़ेशन को बनाने के चरण इस प्रकार हैं:

कल्पना

इस चरण में हम किबाना होम स्क्रीन के बाईं ओर उपलब्ध विज़ुअलाइज़ बटन पर जाते हैं और फिर एक नया विज़ुअलाइज़ेशन जोड़ने का विकल्प चुनते हैं।

निम्न स्क्रीन से पता चलता है कि हम कैसे क्षेत्र मानचित्र विकल्प चुनते हैं।

मेट्रिक्स चुनें

अगली स्क्रीन हमें उन मैट्रिक्स को चुनने के लिए प्रेरित करती है जो कि क्षेत्र मानचित्र बनाने में उपयोग किए जाएंगे। यहां हम मीट्रिक के रूप में औसत मूल्य चुनते हैं और देश_किस_कोड को बाल्टी में फ़ील्ड के रूप में देखा जाता है जिसे विज़ुअलाइज़ेशन बनाने में उपयोग किया जाएगा।

एक बार जब हम चयन लागू करते हैं तो नीचे दिया गया अंतिम परिणाम रीजन मैप दिखाता है। कृपया लेबल में उल्लिखित रंगों और उनके मूल्यों पर ध्यान दें।

पाई चार्ट सबसे सरल और प्रसिद्ध विज़ुअलाइज़ेशन टूल में से एक है। यह एक सर्कल के स्लाइस के रूप में डेटा का प्रतिनिधित्व करता है प्रत्येक रंगीन अलग-अलग। सर्कल के साथ प्रतिशत डेटा मान के साथ लेबल प्रस्तुत किए जा सकते हैं। सर्कल भी डोनट का आकार ले सकता है।

कल्पना

किबाना होम स्क्रीन में, हमें विकल्प नाम विज़ुअलाइज़ मिलता है, जो हमें एलिस्टिक्स खोज में संग्रहीत सूचकांकों से विज़ुअलाइज़ेशन और एकत्रीकरण बनाने की अनुमति देता है। हम एक नया विज़ुअलाइज़ेशन जोड़ना चाहते हैं और नीचे दिखाए गए विकल्प के रूप में पाई चार्ट का चयन करें।

मेट्रिक्स चुनें

अगली स्क्रीन मेट्रिक्स चुनने के लिए हमें संकेत देती है जिसका उपयोग पाई चार्ट बनाने में किया जाएगा। यहाँ हम हिस्टोग्राम के रूप में मीट्रिक और बकेट एग्रीगेशन के रूप में बेस यूनिट मूल्य की गिनती चुनते हैं। इसके अलावा, न्यूनतम अंतराल को 20 के रूप में चुना जाता है। इसलिए, मूल्यों को एक सीमा के रूप में 20 के साथ मूल्यों के ब्लॉक के रूप में प्रदर्शित किया जाएगा।

नीचे का परिणाम चयन को लागू करने के बाद पाई चार्ट दिखाता है। कृपया लेबल में उल्लिखित रंगों और उनके मूल्यों पर ध्यान दें।

पाई चार्ट विकल्प

पाई चार्ट के तहत विकल्प टैब पर जाने पर हम लुक बदलने के साथ-साथ पाई चार्ट में डेटा डिस्प्ले की व्यवस्था के लिए विभिन्न कॉन्फ़िगरेशन विकल्प देख सकते हैं। निम्नलिखित उदाहरण में, पाई चार्ट डोनट के रूप में दिखाई देता है और लेबल शीर्ष पर दिखाई देते हैं।

एक क्षेत्र चार्ट लाइन चार्ट का एक विस्तार है जहां लाइन चार्ट और अक्षों के बीच का क्षेत्र कुछ रंगों के साथ हाइलाइट किया गया है। एक बार चार्ट मूल्यों की एक श्रृंखला में आयोजित डेटा का प्रतिनिधित्व करता है और फिर कुल्हाड़ियों के खिलाफ साजिश रची है। इसमें क्षैतिज पट्टियाँ या ऊर्ध्वाधर पट्टियाँ शामिल हो सकती हैं।

इस अध्याय में हम इन तीनों प्रकार के ग्राफ़ को देखेंगे जो किबाना का उपयोग करके बनाया गया है। जैसा कि पहले के अध्यायों में चर्चा की गई है, हम ईकॉमर्स इंडेक्स में डेटा का उपयोग करना जारी रखेंगे।

क्षेत्र चार्ट

किबाना होम स्क्रीन में, हमें विकल्प नाम विज़ुअलाइज़ मिलता है, जो हमें एलिस्टिक्स खोज में संग्रहीत सूचकांकों से विज़ुअलाइज़ेशन और एकत्रीकरण बनाने की अनुमति देता है। हम एक नया विज़ुअलाइज़ेशन जोड़ना चाहते हैं और नीचे दिए गए चित्र में दिखाए गए विकल्प के रूप में एरिया चार्ट का चयन करें।

मेट्रिक्स चुनें

अगली स्क्रीन मेट्रिक्स चुनने के लिए हमें संकेत देती है जिसका उपयोग एरिया चार्ट बनाने में किया जाएगा। यहाँ हम समष्टि को मीट्रिक के प्रकार के रूप में चुनते हैं। फिर हम मेट्रिक के रूप में उपयोग की जाने वाली फ़ील्ड के रूप में total_quantity फ़ील्ड चुनते हैं। एक्स-एक्सिस पर, हमने ऑर्डर_डेट फील्ड को चुना और श्रृंखला को 5 के आकार में दिए गए मीट्रिक के साथ विभाजित किया।

उपरोक्त कॉन्फ़िगरेशन को चलाने पर, हमें आउटपुट के रूप में निम्न क्षेत्र चार्ट मिलता है -

क्षैतिज बार चार्ट

इसी तरह, हॉरिजॉन्टल बार चार्ट के लिए हम किबाना होम स्क्रीन से नया विज़ुअलाइज़ेशन चुनते हैं और हॉरिज़ॉन्टल बार का विकल्प चुनते हैं। फिर हम नीचे की छवि में दिखाए गए अनुसार मैट्रिक्स का चयन करते हैं। यहां हम दायर की गई उत्पाद मात्रा के लिए एकत्रीकरण के रूप में सम को चुनते हैं। फिर हम फील्ड ऑर्डर की तारीख के लिए डेट हिस्टोग्राम वाली बाल्टी चुनते हैं।

उपरोक्त कॉन्फ़िगरेशन को चलाने पर, हम नीचे दिखाए गए अनुसार एक क्षैतिज बार चार्ट देख सकते हैं -

वर्टिकल बार चार्ट

वर्टिकल बार चार्ट के लिए, हम किबाना होम स्क्रीन से नया विज़ुअलाइज़ेशन चुनते हैं और वर्टिकल बार का विकल्प चुनते हैं। फिर हम नीचे की छवि में दिखाए गए अनुसार मैट्रिक्स का चयन करते हैं।

यहां हम उत्पाद मात्रा नाम के क्षेत्र के एकत्रीकरण के रूप में सम को चुनते हैं। फिर हम साप्ताहिक अंतराल के साथ फील्ड ऑर्डर की तारीख के लिए डेट हिस्टोग्राम वाली बाल्टी चुनते हैं।

उपरोक्त विन्यास को चलाने पर, जैसा कि नीचे दिखाया गया है, एक चार्ट तैयार किया जाएगा -

समय श्रृंखला एक विशिष्ट समय अनुक्रम में डेटा के अनुक्रम का एक प्रतिनिधित्व है। उदाहरण के लिए, महीने के पहले दिन से लेकर आखिरी दिन तक प्रत्येक दिन के लिए डेटा। डेटा बिंदुओं के बीच का अंतराल स्थिर रहता है। कोई भी डेटा सेट जिसमें समय घटक होता है, उसे समय श्रृंखला के रूप में दर्शाया जा सकता है।

इस अध्याय में, हम नमूना ई-कॉमर्स डेटा सेट का उपयोग करेंगे और समय श्रृंखला बनाने के लिए प्रत्येक दिन के आदेशों की संख्या की गणना करेंगे।

मेट्रिक्स चुनें

सबसे पहले, हम सूचकांक पैटर्न, डेटा फ़ील्ड और अंतराल चुनते हैं जो समय श्रृंखला बनाने के लिए उपयोग किया जाएगा। नमूना ईकॉमर्स डेटा सेट से हम ऑर्डर_डेट को क्षेत्र के रूप में चुनते हैं और अंतराल के रूप में 1 डी। हम उपयोग करते हैंPanel Optionsइन विकल्पों को बनाने के लिए टैब। साथ ही हम इस टैब में अन्य मानों को डिफ़ॉल्ट के रूप में छोड़ देते हैं ताकि समय श्रृंखला के लिए डिफ़ॉल्ट रंग और प्रारूप प्राप्त कर सकें।

में Data टैब, हम गणना को विकल्प के रूप में चुनते हैं, सब कुछ विकल्प के रूप में समूह बनाते हैं और समय श्रृंखला चार्ट के लिए एक लेबल लगाते हैं।

परिणाम

इस कॉन्फ़िगरेशन का अंतिम परिणाम निम्नानुसार दिखाई देता है। कृपया ध्यान दें कि हम समय अवधि का उपयोग कर रहे हैंMonth to Dateइस ग्राफ के लिए। अलग-अलग समय अवधि अलग-अलग परिणाम देगी।

एक टैग क्लाउड पाठ का प्रतिनिधित्व करता है, जो कि एक आकर्षक रूप में ज्यादातर कीवर्ड और मेटाडेटा हैं। वे अलग-अलग कोणों में संरेखित होते हैं और विभिन्न रंगों और फ़ॉन्ट आकारों में प्रतिनिधित्व करते हैं। यह डेटा में सबसे प्रमुख शब्दों का पता लगाने में मदद करता है। प्रमुखता एक या एक से अधिक कारकों द्वारा निर्धारित की जा सकती है, जैसे शब्द की आवृत्ति, टैग की असमानता या विशिष्ट शब्दों से जुड़े कुछ भार के आधार पर आदि। नीचे हम एक टैग क्लाउड बनाने के चरण देखते हैं।

कल्पना

किबाना होम स्क्रीन में, हमें विकल्प नाम विज़ुअलाइज़ मिलता है, जो हमें एलिस्टिक्स खोज में संग्रहीत सूचकांकों से विज़ुअलाइज़ेशन और एकत्रीकरण बनाने की अनुमति देता है। हम एक नया विज़ुअलाइज़ेशन जोड़ना चाहते हैं और नीचे दिखाए गए विकल्प के रूप में टैग क्लाउड चुनें -

मेट्रिक्स चुनें

अगली स्क्रीन मेट्रिक्स चुनने के लिए हमें संकेत देती है जिसका उपयोग टैग क्लाउड बनाने में किया जाएगा। यहां हम गणना को एकत्रीकरण मीट्रिक के प्रकार के रूप में चुनते हैं। फिर हम टैग के रूप में उपयोग किए जाने वाले कीवर्ड के रूप में productname फ़ील्ड चुनते हैं।

हमारे द्वारा चयन किए जाने के बाद यहां दिखाया गया परिणाम पाई चार्ट दिखाता है। कृपया लेबल में उल्लिखित रंगों और उनके मूल्यों पर ध्यान दें।

टैग क्लाउड विकल्प

करने के लिए आगे बढ़ रहा है optionsटैग क्लाउड के अंतर्गत टैब हम लुक बदलने के साथ-साथ टैग क्लाउड में डेटा डिस्प्ले की व्यवस्था के लिए विभिन्न कॉन्फ़िगरेशन विकल्प देख सकते हैं। नीचे दिए गए उदाहरण में टैग क्लाउड क्षैतिज और ऊर्ध्वाधर दोनों दिशाओं में फैले टैग के साथ दिखाई देता है।

हीट मैप एक प्रकार का विज़ुअलाइज़ेशन है जिसमें विभिन्न रंगों के ग्राफ में विभिन्न क्षेत्रों का प्रतिनिधित्व किया जाता है। मान लगातार अलग-अलग हो सकते हैं और इसलिए रंगों के रंग r शेड्स मूल्यों के साथ भिन्न होते हैं। वे लगातार बदलते डेटा और असतत डेटा दोनों का प्रतिनिधित्व करने के लिए बहुत उपयोगी हैं।

इस अध्याय में हम heatmap चार्ट बनाने के लिए sample_data_flights नाम के डेटा सेट का उपयोग करेंगे। इसमें हम उड़ानों के मूल देश और गंतव्य देश नाम के चर पर विचार करते हैं और एक गिनती लेते हैं।

किबाना होम स्क्रीन में, हमें विकल्प नाम विज़ुअलाइज़ मिलता है, जो हमें एलिस्टिक्स खोज में संग्रहीत सूचकांकों से विज़ुअलाइज़ेशन और एकत्रीकरण बनाने की अनुमति देता है। हम एक नया विज़ुअलाइज़ेशन जोड़ने के लिए चुनते हैं और नीचे दिखाए गए विकल्प के रूप में हीट मैप का चयन करते हैं;

मेट्रिक्स चुनें

अगली स्क्रीन मेट्रिक्स चुनने के लिए हमें संकेत देती है जिसका उपयोग हीट मैप चार्ट बनाने में किया जाएगा। यहां हम गणना को एकत्रीकरण मीट्रिक के प्रकार के रूप में चुनते हैं। फिर वाई-एक्सिस में बाल्टी के लिए, हम फील्ड ओरिजिनकाउंट्री के लिए एकत्रीकरण के रूप में शर्तें चुनते हैं। एक्स-एक्सिस के लिए, हम उसी एकत्रीकरण का चयन करते हैं, लेकिन उपयोग किए जाने वाले क्षेत्र के रूप में डेस्टकाउंट्री। दोनों मामलों में, हम 5 के रूप में बाल्टी का आकार चुनते हैं।

ऊपर दिखाए गए कॉन्फ़िगरेशन को चलाने पर, हम निम्नानुसार उत्पन्न गर्मी मानचित्र चार्ट प्राप्त करते हैं।

Note - आपको इस वर्ष की तिथि सीमा की अनुमति देनी होगी ताकि ग्राफ एक प्रभावी हीट मैप चार्ट का उत्पादन करने के लिए एक वर्ष के लिए डेटा इकट्ठा करे।

कैनवस एप्लिकेशन किबाना का एक हिस्सा है जो हमें गतिशील, बहु-पृष्ठ और पिक्सेल सही डेटा डिस्प्ले बनाने की अनुमति देता है। इन्फोग्राफिक्स और न केवल चार्ट और मेट्रिसेस बनाने की इसकी क्षमता है जो इसे अद्वितीय और आकर्षक बनाती है। इस अध्याय में हम कैनवास की विभिन्न विशेषताओं को देखेंगे और कैनवास के काम पैड का उपयोग कैसे करें।

एक कैनवस खोलना

किबाना होमपेज पर जाएं और नीचे दिए गए चित्र में दिखाए गए विकल्प का चयन करें। यह आपके पास कैनवास के काम के पैड की सूची को खोलता है। हम अपने अध्ययन के लिए ईकॉमर्स रेवेन्यू ट्रैकिंग चुनते हैं।

क्लोनिंग एक वर्कपैड

हम क्लोन करते हैं [eCommerce] Revenue Trackingहमारे अध्ययन में उपयोग किए जाने वाले वर्कपैड। इसे क्लोन करने के लिए, हम इस वर्कपैड के नाम के साथ पंक्ति को हाइलाइट करते हैं और फिर नीचे दिए गए चित्र में दिखाए अनुसार क्लोन बटन का उपयोग करते हैं -

उपरोक्त क्लोन के परिणामस्वरूप, हमें एक नया कार्य पैड मिलेगा जिसका नाम है [eCommerce] Revenue Tracking – Copy जिसे खोलने पर नीचे का इन्फोग्राफिक्स दिखाई देगा।

यह अच्छी तस्वीरों और चार्ट के साथ श्रेणी के अनुसार कुल बिक्री और राजस्व का वर्णन करता है।

वर्कपैड को संशोधित करना

हम दाहिने हाथ की ओर टैब में उपलब्ध विकल्पों का उपयोग करके कार्यक्षेत्र में शैली और आंकड़े बदल सकते हैं। यहाँ हम नीचे दिए गए चित्र में दिखाए गए अनुसार एक अलग रंग का चयन करके कार्यक्षेत्र की पृष्ठभूमि का रंग बदलने का लक्ष्य रखते हैं। रंग चयन तुरंत प्रभाव में आता है और हमें नीचे दिखाए अनुसार परिणाम मिलता है -

किबाना विभिन्न स्रोतों से लॉग डेटा की कल्पना करने में भी मदद कर सकता है। लॉग बुनियादी ढांचे के स्वास्थ्य, प्रदर्शन की जरूरतों और सुरक्षा उल्लंघन विश्लेषण आदि के लिए महत्वपूर्ण स्रोत हैं। किबाना विभिन्न लॉग्स से जुड़ सकते हैं जैसे वेब सर्वर लॉग्स, इलास्टिसर्च लॉग्स और क्लाउडवॉच लॉग्स आदि।

लॉगस्टैश लॉग्स

किबाना में, हम विज़ुअलाइज़ेशन के लिए लॉगस्टैश लॉग से कनेक्ट कर सकते हैं। सबसे पहले हम किबाना होम स्क्रीन से लॉग्स बटन चुनते हैं जैसा कि नीचे दिखाया गया है -

फिर हम विकल्प बदलें स्रोत कॉन्फ़िगरेशन चुनें जो हमें लॉगस्टैश को स्रोत के रूप में चुनने का विकल्प लाता है। नीचे दी गई स्क्रीन अन्य प्रकार के विकल्पों को भी दिखाती है जो हमारे पास एक लॉग स्रोत के रूप में हैं।

आप ऐतिहासिक लॉग डेटा पर ध्यान केंद्रित करने के लिए लाइव लॉग टेलिंग या पॉज़ स्ट्रीमिंग के लिए डेटा स्ट्रीम कर सकते हैं। जब आप लॉग्स को स्ट्रीम कर रहे होते हैं, तो कंसोल पर सबसे हाल का लॉग सबसे नीचे दिखाई देता है।

आगे के संदर्भ के लिए, आप हमारे लॉगस्टैश ट्यूटोरियल का उल्लेख कर सकते हैं ।