किबाना - एकत्रीकरण और मेट्रिक्स

किबाना सीखने के दौरान आपके पास दो शब्द बार-बार आते हैं, वो हैं बकेट और मेट्रिक्स एग्रीगेशन। इस अध्याय में चर्चा की गई है कि वे किबाना में क्या भूमिका निभाते हैं और उनके बारे में अधिक विवरण।

किबाना एग्रीगेशन क्या है?

एकत्रीकरण दस्तावेजों के संग्रह या किसी विशेष खोज क्वेरी या फिल्टर से प्राप्त दस्तावेजों के एक समूह को संदर्भित करता है। कलीसिया में वांछित दृश्य निर्माण के लिए एकत्रीकरण मुख्य अवधारणा बनाता है।

जब भी आप कोई विज़ुअलाइज़ेशन करते हैं, तो आपको मापदंड तय करने की आवश्यकता होती है, जिसका अर्थ है कि आप किस तरह से उस पर मीट्रिक करने के लिए डेटा को समूहित करना चाहते हैं।

इस भाग में, हम दो प्रकार के एकत्रीकरण पर चर्चा करेंगे -

  • बकेट एग्रीगेशन
  • मीट्रिक एकत्रीकरण

बकेट एग्रीगेशन

एक बाल्टी में मुख्य रूप से एक कुंजी और एक दस्तावेज होता है। जब एकत्रीकरण निष्पादित किया जाता है, तो दस्तावेजों को संबंधित बाल्टी में रखा जाता है। तो अंत में आपके पास बकेट की एक सूची होनी चाहिए, प्रत्येक में दस्तावेजों की एक सूची होगी। बकेट एग्रीगेशन की सूची आपको किबाना में दृश्य बनाते समय दिखाई देगी -

बाल्टी एकत्रीकरण की निम्नलिखित सूची है -

  • डेट हिस्टोग्राम
  • तिथि सीमा
  • Filters
  • Histogram
  • IPv4 रेंज
  • Range
  • महत्वपूर्ण शर्तें
  • Terms

बनाते समय, आपको उनमें से एक को बाल्टी एग्रीगेशन के लिए तय करने की आवश्यकता होती है, ताकि दस्तावेजों को बाल्टी के अंदर रखा जा सके।

उदाहरण के लिए, विश्लेषण के लिए, उन देशों के डेटा पर विचार करें जिन्हें हमने इस ट्यूटोरियल की शुरुआत में अपलोड किया है। देशों के सूचकांक में उपलब्ध क्षेत्र देश का नाम, क्षेत्र, जनसंख्या, क्षेत्र है। देशों के आंकड़ों में, हम देश का नाम अपनी जनसंख्या, क्षेत्र और क्षेत्र के साथ रखते हैं।

हमें लगता है कि हम क्षेत्रवार डेटा चाहते हैं। फिर, प्रत्येक क्षेत्र में उपलब्ध देश हमारी खोज क्वेरी बन जाते हैं, इसलिए इस क्षेत्र में हमारी बाल्टियाँ बन जाएंगी। नीचे दिए गए ब्लॉक आरेख से पता चलता है कि R1, R2, R3, R4, R5 और R6 वह बाल्टी हैं जो हमें मिलीं और c1, c2 ..c25 उन दस्तावेजों की सूची हैं जो बाल्टी R1 से R6 तक के हिस्से हैं।

हम देख सकते हैं कि प्रत्येक बाल्टी में कुछ वृत्त हैं। वे खोज मानदंडों के आधार पर दस्तावेजों के सेट हैं और प्रत्येक बाल्टी में गिरने पर विचार किया जाता है। बाल्टी आर 1 में, हमारे पास दस्तावेज सी 1, सी 8 और सी 15 हैं। ये दस्तावेज़ अन्य देशों के लिए समान क्षेत्र में पड़ने वाले देश हैं। इसलिए अगर हम बकेट आर 1 में देशों की गिनती करते हैं तो यह 3 है, आर 2 के लिए 6, आर 3 के लिए 6, आर 4 के लिए 2, आर 5 के लिए 5 और आर 6 के लिए 4 है।

इसलिए बाल्टी एकत्रीकरण के माध्यम से, हम दस्तावेज़ को बाल्टी में एकत्र कर सकते हैं और उन बाल्टियों में दस्तावेज़ों की एक सूची है जैसा कि ऊपर दिखाया गया है।

हमारी अब तक की बाल्टी एग्रीगेशन की सूची है -

  • डेट हिस्टोग्राम
  • तिथि सीमा
  • Filters
  • Histogram
  • IPv4 रेंज
  • Range
  • महत्वपूर्ण शर्तें
  • Terms

आइए अब चर्चा करते हैं कि इन बाल्टियों को एक-एक करके कैसे बनाया जाए।

डेट हिस्टोग्राम

दिनांक हिस्टोग्राम एकत्रीकरण का उपयोग दिनांक फ़ील्ड पर किया जाता है। इसलिए आप जिस इंडेक्स को विज़ुअलाइज़ करने के लिए उपयोग करते हैं, यदि आपके पास उस इंडेक्स में दिनांक फ़ील्ड है तो केवल इस एकत्रीकरण प्रकार का उपयोग किया जा सकता है। यह एक बहु-बाल्टी एकत्रीकरण है, जिसका अर्थ है कि आपके पास कुछ दस्तावेजों में 1 बाल्टी से अधिक का हिस्सा हो सकता है। इस एकत्रीकरण के लिए एक अंतराल का उपयोग किया जाना है और विवरण नीचे दिखाए गए हैं -

जब आप दिनांक हिस्टोग्राम के रूप में बाल्टी एकत्रीकरण का चयन करते हैं, तो यह फ़ील्ड विकल्प प्रदर्शित करेगा जो केवल दिनांक संबंधित फ़ील्ड देगा। एक बार जब आप अपने क्षेत्र का चयन करते हैं, तो आपको अंतराल का चयन करने की आवश्यकता होती है जिसमें निम्नलिखित विवरण होते हैं -

इसलिए चुने गए सूचकांक और क्षेत्र और अंतराल के आधार पर दस्तावेजों को दस्तावेजों को बाल्टी में वर्गीकृत किया जाएगा। उदाहरण के लिए, यदि आपने अंतराल को मासिक के रूप में चुना है, तो तिथि के आधार पर दस्तावेजों को बाल्टी में बदल दिया जाएगा और महीने के आधार पर, जनवरी-दिसंबर को दस्तावेजों को बाल्टी में डाल दिया जाएगा। यहाँ Jan, Feb, .. Dec बाल्टी होगी।

तिथि सीमा

इस एकत्रीकरण प्रकार का उपयोग करने के लिए आपको एक दिनांक फ़ील्ड की आवश्यकता है। यहां हमारे पास एक तिथि सीमा होगी, जो कि तारीख से है और आज तक दी जानी है। बाल्टी में दिए गए फॉर्म और तारीख के आधार पर इसके दस्तावेज होंगे।

फिल्टर

फ़िल्टर प्रकार एकत्रीकरण के साथ, बाल्टी फिल्टर के आधार पर बनाई जाएगी। यहां आपको एक बहु-बाल्टी मिल जाएगी, जो फ़िल्टर मानदंड के आधार पर एक दस्तावेज़ एक या अधिक बाल्टी में मौजूद हो सकती है।

फ़िल्टर का उपयोग करके, उपयोगकर्ता अपने प्रश्नों को फ़िल्टर विकल्प में नीचे लिखे अनुसार लिख सकते हैं -

Add Filter बटन का उपयोग करके आप अपनी पसंद के कई फ़िल्टर जोड़ सकते हैं।

हिस्टोग्राम

इस प्रकार के एकत्रीकरण को एक संख्या क्षेत्र पर लागू किया जाता है और यह एक बाल्टी में दस्तावेजों को लगाए गए अंतराल के आधार पर समूहित करेगा। उदाहरण के लिए, 0-50,50-100,100-150 आदि।

IPv4 रेंज

इस प्रकार के एकत्रीकरण का उपयोग किया जाता है और मुख्य रूप से आईपी पते के लिए उपयोग किया जाता है।

हमारे पास जो इंडेक्स है वह कंट्रासेडाटा -28.12.2018 का प्रकार आईपी का क्षेत्र नहीं है, इसलिए यह एक संदेश दिखाता है जैसा कि ऊपर दिखाया गया है। यदि आपके पास IP फ़ील्ड है, तो आप ऊपर और नीचे के मूल्यों को निर्दिष्ट कर सकते हैं जैसा कि ऊपर दिखाया गया है।

रेंज

इस प्रकार के एकत्रीकरण के लिए खेतों की संख्या प्रकार की होनी चाहिए। आपको रेंज निर्दिष्ट करने की आवश्यकता है और दस्तावेजों को सीमा में गिरने वाली बाल्टियों में सूचीबद्ध किया जाएगा।

यदि आप Add Range बटन पर क्लिक करके आवश्यकता हो तो और रेंज जोड़ सकते हैं।

महत्वपूर्ण शर्तें

इस प्रकार का एकत्रीकरण ज्यादातर स्ट्रिंग क्षेत्रों पर उपयोग किया जाता है।

मामले

इस प्रकार के एकत्रीकरण का उपयोग सभी उपलब्ध क्षेत्रों अर्थात् नंबर, स्ट्रिंग, दिनांक, बूलियन, आईपी एड्रेस, टाइमस्टैम्प आदि पर किया जाता है। ध्यान दें कि यह वह एकत्रीकरण है जिसका उपयोग हम अपने सभी विज़ुअलाइज़ेशन में करने जा रहे हैं, जिसमें हम इस पर काम करने जा रहे हैं। ट्यूटोरियल।

हमारे पास एक विकल्प आदेश है जिसके द्वारा हम अपने द्वारा चयनित मीट्रिक के आधार पर डेटा को समूहीकृत करेंगे। आकार उस बाल्टी को दर्शाता है जिसे आप विज़ुअलाइज़ेशन में प्रदर्शित करना चाहते हैं।

इसके बाद, हम मेट्रिक एग्रीगेशन के बारे में बात करते हैं।

मीट्रिक एकत्रीकरण

मीट्रिक एग्रीगेशन मुख्य रूप से बाल्टी में मौजूद दस्तावेजों पर किए गए गणित की गणना को संदर्भित करता है। उदाहरण के लिए यदि आप एक संख्या फ़ील्ड चुनते हैं तो मीट्रिक गणना आप उस पर कर सकते हैं COUNT, SUM, MIN, MAX, AVERP आदि।

मीट्रिक एकत्रीकरण की एक सूची जिस पर हम चर्चा करेंगे, वह यहाँ दी गई है -

इस खंड में, हम उन महत्वपूर्ण लोगों पर चर्चा करते हैं, जिनका हम अक्सर उपयोग करने जा रहे हैं -

  • Average
  • Count
  • Max
  • Min
  • Sum

मीट्रिक को व्यक्तिगत बकेट एग्रीगेशन पर लागू किया जाएगा जिसकी हमने पहले ही ऊपर चर्चा की है।

इसके बाद, यहां मेट्रिक्स एकत्रीकरण की सूची पर चर्चा करते हैं -

औसत

यह बाल्टी में मौजूद दस्तावेजों के मूल्यों के लिए औसत देगा। उदाहरण के लिए -

R1 से R6 बाल्टियाँ हैं। R1 में हमारे पास c1, c8 और c15 हैं। C1 का मान 300 है, c8 का 500 और c15 का मान 700 है। अब R1 बाल्टी का औसत मान प्राप्त करें

R1 = c1 का मान + c8 का मान + मान c15 / 3 = 300 + 500 + 700/3 = 500

बाल्टी R1 के लिए औसत 500 है। यहां दस्तावेज़ का मूल्य कुछ भी हो सकता है यदि आप उन देशों के आंकड़ों पर विचार करते हैं जो उस क्षेत्र में देश का क्षेत्र हो सकता है।

गिनती

इससे बकेट में मौजूद दस्तावेजों की गिनती होगी। मान लीजिए कि आप क्षेत्र में मौजूद देशों की गिनती चाहते हैं, तो यह बाल्टी में मौजूद कुल दस्तावेज होंगे। उदाहरण के लिए, R1 यह 3, R2 = 6, R3 = 5, R4 = 2, R5 = 5 और R3 = 4 होगा।

मैक्स

यह बाल्टी में मौजूद दस्तावेज़ का अधिकतम मूल्य देगा। उपरोक्त उदाहरण को ध्यान में रखते हुए यदि हमारे पास क्षेत्र बकेट में क्षेत्रवार देश डेटा हैं। प्रत्येक क्षेत्र के लिए अधिकतम अधिकतम क्षेत्रफल वाला देश होगा। अतः इसका प्रत्येक क्षेत्र से एक देश होगा अर्थात R1 से R6।

में

यह बाल्टी में मौजूद दस्तावेज़ का न्यूनतम मूल्य देगा। उपरोक्त उदाहरण को ध्यान में रखते हुए यदि हमारे पास क्षेत्र बकेट में क्षेत्रवार देश डेटा हैं। प्रत्येक क्षेत्र के लिए न्यूनतम क्षेत्र वाला देश होगा। अतः इसका प्रत्येक क्षेत्र से एक देश होगा अर्थात R1 से R6।

योग

यह बाल्टी में मौजूद दस्तावेज़ के मूल्यों का योग देगा। उदाहरण के लिए यदि आप उपरोक्त उदाहरण पर विचार करते हैं यदि हम क्षेत्र में कुल क्षेत्र या देश चाहते हैं, तो यह क्षेत्र में मौजूद दस्तावेजों का योग होगा।

उदाहरण के लिए, क्षेत्र R1 में कुल देशों को जानने के लिए यह 3, R2 = 6, R3 = 5, R4 = 2, R5 = 5 और R6 = 4 होगा।

यदि हमारे पास आर 1 से आर 6 तक के क्षेत्र में क्षेत्र के साथ दस्तावेज हैं, तो क्षेत्र के लिए देशवार क्षेत्र होगा।