केडीबी + आर्किटेक्चर
Kdb + एक उच्च-प्रदर्शन, उच्च-मात्रा डेटाबेस है जिसे डेटा के जबरदस्त संस्करणों को संभालने के लिए शुरू से डिज़ाइन किया गया है। यह पूरी तरह से 64-बिट है, और इसमें अंतर्निहित मल्टी-कोर प्रसंस्करण और मल्टी-थ्रेडिंग है। उसी वास्तुकला का उपयोग वास्तविक समय और ऐतिहासिक डेटा के लिए किया जाता है। डेटाबेस में अपनी शक्तिशाली क्वेरी भाषा शामिल है,q, इसलिए एनालिटिक्स को सीधे डेटा पर चलाया जा सकता है।
kdb+tick एक आर्किटेक्चर है जो वास्तविक समय और ऐतिहासिक डेटा को पकड़ने, प्रसंस्करण और क्वेरी करने की अनुमति देता है।
केडीबी + / टिक आर्किटेक्चर
निम्नलिखित चित्रण एक विशिष्ट केडीबी + / टिक वास्तुकला की एक सामान्यीकृत रूपरेखा प्रदान करता है, जिसके बाद विभिन्न घटकों का संक्षिप्त विवरण और डेटा का प्रवाह होता है।
Data Feeds एक टाइम सीरीज़ डेटा है जो ज्यादातर डेटा फीड प्रोवाइडर जैसे कि रायटर, ब्लूमबर्ग या सीधे एक्सचेंजों द्वारा प्रदान किया जाता है।
संबंधित डेटा प्राप्त करने के लिए, डेटा फीड से डेटा पार्स किया जाता है feed handler।
फीड हैंडलर द्वारा डेटा पार्स किए जाने के बाद, यह चला जाता है ticker-plant।
किसी भी विफलता से डेटा को पुनर्प्राप्त करने के लिए, टिकर-प्लांट पहले लॉग फ़ाइल में नए डेटा को अपडेट / संग्रहीत करता है और फिर अपनी खुद की तालिकाओं को अपडेट करता है।
आंतरिक तालिकाओं और लॉग फ़ाइलों को अपडेट करने के बाद, ऑन-टाइम लूप डेटा को रियल-टाइम डेटाबेस और डेटा के लिए अनुरोध करने वाले सभी जंजीरों को लगातार भेजा / प्रकाशित किया जाता है।
एक व्यावसायिक दिन के अंत में, लॉग फ़ाइल को हटा दिया जाता है, एक नया बनाया गया और वास्तविक समय डेटाबेस ऐतिहासिक डेटाबेस पर सहेजा जाता है। एक बार जब सभी डेटा ऐतिहासिक डेटाबेस पर सहेजा जाता है, तो वास्तविक समय डेटाबेस अपनी तालिकाओं को शुद्ध करता है।
केडीबी + टिक आर्किटेक्चर के घटक
डाटा फीड
डाटा फीड किसी भी बाजार या अन्य समय श्रृंखला डेटा हो सकता है। फीड-हैंडलर को कच्चे इनपुट के रूप में डेटा फीड पर विचार करें। फ़ीड सीधे एक्सचेंज (लाइव-स्ट्रीमिंग डेटा), थॉमसन-रॉयटर्स, ब्लूमबर्ग या किसी अन्य बाहरी एजेंसियों जैसे समाचार / डेटा प्रदाताओं से हो सकते हैं।
हैंडलर खिलाएं
एक फीड हैंडलर kdb + को लिखने के लिए उपयुक्त डेटा स्ट्रीम को एक प्रारूप में परिवर्तित करता है। यह डेटा फ़ीड से जुड़ा है और यह डेटा को फ़ीड-विशिष्ट प्रारूप से Kdb + संदेश में परिवर्तित करता है और जिसे टिकर-प्लांट प्रक्रिया में प्रकाशित किया जाता है। आम तौर पर एक फीड हैंडलर का उपयोग निम्नलिखित ऑपरेशन करने के लिए किया जाता है -
- नियमों के एक सेट के अनुसार डेटा कैप्चर करें।
- उस डेटा का एक प्रारूप से दूसरे में अनुवाद (समृद्ध) करें।
- सबसे हाल के मूल्यों को पकड़ो।
टिकर का पौधा
टिकर प्लांट KDB + वास्तुकला का सबसे महत्वपूर्ण घटक है। यह टिकर प्लांट है जिसके साथ वित्तीय डेटा तक पहुंचने के लिए वास्तविक समय डेटाबेस या सीधे ग्राहक (क्लाइंट) जुड़े हुए हैं। में संचालित होता हैpublish and subscribeतंत्र। एक बार जब आप एक सदस्यता (लाइसेंस) प्राप्त करते हैं, तो प्रकाशक (टिकर प्लांट) से एक टिक (नियमित रूप से) प्रकाशन परिभाषित किया जाता है। यह निम्नलिखित कार्य करता है -
फीड हैंडलर से डेटा प्राप्त करता है।
टिकर प्लांट को डेटा प्राप्त होने के तुरंत बाद, यह एक लॉग फ़ाइल के रूप में एक कॉपी संग्रहीत करता है और एक बार टिकर प्लांट को कोई भी अपडेट मिलने के बाद इसे अपडेट कर देता है ताकि किसी भी विफलता के मामले में, हमें कोई डेटा हानि न हो।
ग्राहक (रियल-टाइम सब्सक्राइबर) सीधे टिकर-प्लांट की सदस्यता ले सकते हैं।
प्रत्येक व्यावसायिक दिन के अंत में, अर्थात, एक बार वास्तविक समय डेटाबेस को अंतिम संदेश प्राप्त होने के बाद, यह आज के सभी डेटा को ऐतिहासिक डेटाबेस में संग्रहीत करता है और उन सभी ग्राहकों को समान धक्का देता है जिन्होंने आज के डेटा के लिए सदस्यता ली है। फिर यह अपनी सभी तालिकाओं को रीसेट करता है। ऐतिहासिक डेटाबेस या डेटा से सीधे जुड़े हुए सब्सक्राइबर को रियल टाइम डेटाबेस (rtdb) में संग्रहीत करने के बाद लॉग फ़ाइल को भी हटा दिया जाता है।
परिणामस्वरूप, टिकर-प्लांट, रीयल-टाइम डेटाबेस और ऐतिहासिक डेटाबेस 24/7 आधार पर चालू होते हैं।
चूंकि टिकर-प्लांट एक Kdb + अनुप्रयोग है, इसलिए इसकी तालिकाओं का उपयोग करके इसे देखा जा सकता है qकिसी भी अन्य Kdb + डेटाबेस की तरह। सभी टिकर-प्लांट ग्राहकों को केवल ग्राहकों के रूप में डेटाबेस तक पहुंच होनी चाहिए।
वास्तविक समय डेटाबेस
एक वास्तविक समय डेटाबेस (आरडीबी) आज के डेटा को संग्रहीत करता है। यह सीधे टिकर प्लांट से जुड़ा हुआ है। आमतौर पर इसे बाजार के घंटों (एक दिन) के दौरान मेमोरी में स्टोर किया जाता है और दिन के अंत में ऐतिहासिक डेटाबेस (एचडीबी) को लिखा जाता है। जैसा कि डेटा (rdb डेटा) मेमोरी में संग्रहीत किया जाता है, प्रसंस्करण बेहद तेज है।
जैसा कि kdb + प्रति दिन डेटा के अपेक्षित आकार से चार गुना अधिक रैम आकार की अनुशंसा करता है, rdb पर चलने वाली क्वेरी बहुत तेज़ होती है और बेहतर प्रदर्शन प्रदान करती है। चूंकि एक वास्तविक समय डेटाबेस में केवल आज का डेटा होता है, इसलिए दिनांक स्तंभ (पैरामीटर) की आवश्यकता नहीं होती है।
उदाहरण के लिए, हम rdb प्रश्नों की तरह हो सकते हैं,
select from trade where sym = `ibm
OR
select from trade where sym = `ibm, price > 100
ऐतिहासिक डेटाबेस
यदि हमें किसी कंपनी के अनुमानों की गणना करनी है, तो हमें उसका ऐतिहासिक डेटा उपलब्ध होना चाहिए। एक ऐतिहासिक डेटाबेस (एचडीबी) अतीत में किए गए लेनदेन का डेटा रखता है। प्रत्येक नए दिन का रिकॉर्ड दिन के अंत में एचडीबी में जोड़ा जाएगा। एचडीबी में बड़ी तालिकाओं को या तो संग्रहीत किया जाता है (प्रत्येक स्तंभ अपनी फ़ाइल में संग्रहीत किया जाता है) या उन्हें अस्थायी डेटा द्वारा विभाजित किया जाता है। इसके अलावा कुछ बहुत बड़े डेटाबेस का उपयोग करके आगे विभाजन किया जा सकता हैpar.txt (फाइल)।
बड़ी तालिका से डेटा को खोजते या एक्सेस करते समय ये स्टोरेज स्ट्रेटेजी (स्पलैड, पार्टीशन इत्यादि) कुशल होते हैं।
एक ऐतिहासिक डेटाबेस का उपयोग आंतरिक और बाह्य रिपोर्टिंग उद्देश्यों के लिए भी किया जा सकता है, अर्थात, एनालिटिक्स के लिए। उदाहरण के लिए, मान लें कि हम व्यापार (या किसी भी) तालिका नाम से किसी विशेष दिन के लिए आईबीएम की कंपनी ट्रेडों को प्राप्त करना चाहते हैं, हमें निम्नानुसार एक प्रश्न लिखना होगा -
thisday: 2014.10.12
select from trade where date = thisday, sym =`ibm
Note - जैसे ही हम कुछ अवलोकन करेंगे हम इस तरह के सभी प्रश्नों को लिखेंगे q भाषा: हिन्दी।