केडीबी + आर्किटेक्चर

Kdb + एक उच्च-प्रदर्शन, उच्च-मात्रा डेटाबेस है जिसे डेटा के जबरदस्त संस्करणों को संभालने के लिए शुरू से डिज़ाइन किया गया है। यह पूरी तरह से 64-बिट है, और इसमें अंतर्निहित मल्टी-कोर प्रसंस्करण और मल्टी-थ्रेडिंग है। उसी वास्तुकला का उपयोग वास्तविक समय और ऐतिहासिक डेटा के लिए किया जाता है। डेटाबेस में अपनी शक्तिशाली क्वेरी भाषा शामिल है,q, इसलिए एनालिटिक्स को सीधे डेटा पर चलाया जा सकता है।

kdb+tick एक आर्किटेक्चर है जो वास्तविक समय और ऐतिहासिक डेटा को पकड़ने, प्रसंस्करण और क्वेरी करने की अनुमति देता है।

केडीबी + / टिक आर्किटेक्चर

निम्नलिखित चित्रण एक विशिष्ट केडीबी + / टिक वास्तुकला की एक सामान्यीकृत रूपरेखा प्रदान करता है, जिसके बाद विभिन्न घटकों का संक्षिप्त विवरण और डेटा का प्रवाह होता है।

  • Data Feeds एक टाइम सीरीज़ डेटा है जो ज्यादातर डेटा फीड प्रोवाइडर जैसे कि रायटर, ब्लूमबर्ग या सीधे एक्सचेंजों द्वारा प्रदान किया जाता है।

  • संबंधित डेटा प्राप्त करने के लिए, डेटा फीड से डेटा पार्स किया जाता है feed handler

  • फीड हैंडलर द्वारा डेटा पार्स किए जाने के बाद, यह चला जाता है ticker-plant

  • किसी भी विफलता से डेटा को पुनर्प्राप्त करने के लिए, टिकर-प्लांट पहले लॉग फ़ाइल में नए डेटा को अपडेट / संग्रहीत करता है और फिर अपनी खुद की तालिकाओं को अपडेट करता है।

  • आंतरिक तालिकाओं और लॉग फ़ाइलों को अपडेट करने के बाद, ऑन-टाइम लूप डेटा को रियल-टाइम डेटाबेस और डेटा के लिए अनुरोध करने वाले सभी जंजीरों को लगातार भेजा / प्रकाशित किया जाता है।

  • एक व्यावसायिक दिन के अंत में, लॉग फ़ाइल को हटा दिया जाता है, एक नया बनाया गया और वास्तविक समय डेटाबेस ऐतिहासिक डेटाबेस पर सहेजा जाता है। एक बार जब सभी डेटा ऐतिहासिक डेटाबेस पर सहेजा जाता है, तो वास्तविक समय डेटाबेस अपनी तालिकाओं को शुद्ध करता है।

केडीबी + टिक आर्किटेक्चर के घटक

डाटा फीड

डाटा फीड किसी भी बाजार या अन्य समय श्रृंखला डेटा हो सकता है। फीड-हैंडलर को कच्चे इनपुट के रूप में डेटा फीड पर विचार करें। फ़ीड सीधे एक्सचेंज (लाइव-स्ट्रीमिंग डेटा), थॉमसन-रॉयटर्स, ब्लूमबर्ग या किसी अन्य बाहरी एजेंसियों जैसे समाचार / डेटा प्रदाताओं से हो सकते हैं।

हैंडलर खिलाएं

एक फीड हैंडलर kdb + को लिखने के लिए उपयुक्त डेटा स्ट्रीम को एक प्रारूप में परिवर्तित करता है। यह डेटा फ़ीड से जुड़ा है और यह डेटा को फ़ीड-विशिष्ट प्रारूप से Kdb + संदेश में परिवर्तित करता है और जिसे टिकर-प्लांट प्रक्रिया में प्रकाशित किया जाता है। आम तौर पर एक फीड हैंडलर का उपयोग निम्नलिखित ऑपरेशन करने के लिए किया जाता है -

  • नियमों के एक सेट के अनुसार डेटा कैप्चर करें।
  • उस डेटा का एक प्रारूप से दूसरे में अनुवाद (समृद्ध) करें।
  • सबसे हाल के मूल्यों को पकड़ो।

टिकर का पौधा

टिकर प्लांट KDB + वास्तुकला का सबसे महत्वपूर्ण घटक है। यह टिकर प्लांट है जिसके साथ वित्तीय डेटा तक पहुंचने के लिए वास्तविक समय डेटाबेस या सीधे ग्राहक (क्लाइंट) जुड़े हुए हैं। में संचालित होता हैpublish and subscribeतंत्र। एक बार जब आप एक सदस्यता (लाइसेंस) प्राप्त करते हैं, तो प्रकाशक (टिकर प्लांट) से एक टिक (नियमित रूप से) प्रकाशन परिभाषित किया जाता है। यह निम्नलिखित कार्य करता है -

  • फीड हैंडलर से डेटा प्राप्त करता है।

  • टिकर प्लांट को डेटा प्राप्त होने के तुरंत बाद, यह एक लॉग फ़ाइल के रूप में एक कॉपी संग्रहीत करता है और एक बार टिकर प्लांट को कोई भी अपडेट मिलने के बाद इसे अपडेट कर देता है ताकि किसी भी विफलता के मामले में, हमें कोई डेटा हानि न हो।

  • ग्राहक (रियल-टाइम सब्सक्राइबर) सीधे टिकर-प्लांट की सदस्यता ले सकते हैं।

  • प्रत्येक व्यावसायिक दिन के अंत में, अर्थात, एक बार वास्तविक समय डेटाबेस को अंतिम संदेश प्राप्त होने के बाद, यह आज के सभी डेटा को ऐतिहासिक डेटाबेस में संग्रहीत करता है और उन सभी ग्राहकों को समान धक्का देता है जिन्होंने आज के डेटा के लिए सदस्यता ली है। फिर यह अपनी सभी तालिकाओं को रीसेट करता है। ऐतिहासिक डेटाबेस या डेटा से सीधे जुड़े हुए सब्सक्राइबर को रियल टाइम डेटाबेस (rtdb) में संग्रहीत करने के बाद लॉग फ़ाइल को भी हटा दिया जाता है।

  • परिणामस्वरूप, टिकर-प्लांट, रीयल-टाइम डेटाबेस और ऐतिहासिक डेटाबेस 24/7 आधार पर चालू होते हैं।

चूंकि टिकर-प्लांट एक Kdb + अनुप्रयोग है, इसलिए इसकी तालिकाओं का उपयोग करके इसे देखा जा सकता है qकिसी भी अन्य Kdb + डेटाबेस की तरह। सभी टिकर-प्लांट ग्राहकों को केवल ग्राहकों के रूप में डेटाबेस तक पहुंच होनी चाहिए।

वास्तविक समय डेटाबेस

एक वास्तविक समय डेटाबेस (आरडीबी) आज के डेटा को संग्रहीत करता है। यह सीधे टिकर प्लांट से जुड़ा हुआ है। आमतौर पर इसे बाजार के घंटों (एक दिन) के दौरान मेमोरी में स्टोर किया जाता है और दिन के अंत में ऐतिहासिक डेटाबेस (एचडीबी) को लिखा जाता है। जैसा कि डेटा (rdb डेटा) मेमोरी में संग्रहीत किया जाता है, प्रसंस्करण बेहद तेज है।

जैसा कि kdb + प्रति दिन डेटा के अपेक्षित आकार से चार गुना अधिक रैम आकार की अनुशंसा करता है, rdb पर चलने वाली क्वेरी बहुत तेज़ होती है और बेहतर प्रदर्शन प्रदान करती है। चूंकि एक वास्तविक समय डेटाबेस में केवल आज का डेटा होता है, इसलिए दिनांक स्तंभ (पैरामीटर) की आवश्यकता नहीं होती है।

उदाहरण के लिए, हम rdb प्रश्नों की तरह हो सकते हैं,

select from trade where sym = `ibm

OR

select from trade where sym = `ibm, price > 100

ऐतिहासिक डेटाबेस

यदि हमें किसी कंपनी के अनुमानों की गणना करनी है, तो हमें उसका ऐतिहासिक डेटा उपलब्ध होना चाहिए। एक ऐतिहासिक डेटाबेस (एचडीबी) अतीत में किए गए लेनदेन का डेटा रखता है। प्रत्येक नए दिन का रिकॉर्ड दिन के अंत में एचडीबी में जोड़ा जाएगा। एचडीबी में बड़ी तालिकाओं को या तो संग्रहीत किया जाता है (प्रत्येक स्तंभ अपनी फ़ाइल में संग्रहीत किया जाता है) या उन्हें अस्थायी डेटा द्वारा विभाजित किया जाता है। इसके अलावा कुछ बहुत बड़े डेटाबेस का उपयोग करके आगे विभाजन किया जा सकता हैpar.txt (फाइल)।

बड़ी तालिका से डेटा को खोजते या एक्सेस करते समय ये स्टोरेज स्ट्रेटेजी (स्पलैड, पार्टीशन इत्यादि) कुशल होते हैं।

एक ऐतिहासिक डेटाबेस का उपयोग आंतरिक और बाह्य रिपोर्टिंग उद्देश्यों के लिए भी किया जा सकता है, अर्थात, एनालिटिक्स के लिए। उदाहरण के लिए, मान लें कि हम व्यापार (या किसी भी) तालिका नाम से किसी विशेष दिन के लिए आईबीएम की कंपनी ट्रेडों को प्राप्त करना चाहते हैं, हमें निम्नानुसार एक प्रश्न लिखना होगा -

thisday: 2014.10.12

select from trade where date = thisday, sym =`ibm

Note - जैसे ही हम कुछ अवलोकन करेंगे हम इस तरह के सभी प्रश्नों को लिखेंगे q भाषा: हिन्दी।