अपाचे फ्लिंक - वास्तविक समय प्रसंस्करण बनाम बैच

बिग डेटा के संदर्भ में, दो प्रकार के प्रसंस्करण हैं -

  • बैच प्रसंस्करण
  • वास्तविक समय प्रसंस्करण

समय के साथ एकत्र किए गए आंकड़ों के आधार पर प्रसंस्करण को बैच प्रसंस्करण कहा जाता है। उदाहरण के लिए, एक बैंक प्रबंधक पिछले 1 महीने में रद्द किए गए चेक की संख्या जानने के लिए पिछले एक महीने के डेटा (समय के साथ एकत्र) को संसाधित करना चाहता है।

तत्काल परिणाम के लिए तत्काल डेटा पर आधारित प्रसंस्करण को रीयल-टाइम प्रोसेसिंग कहा जाता है। उदाहरण के लिए, एक बैंक प्रबंधक एक धोखाधड़ी लेनदेन (तत्काल परिणाम) के तुरंत बाद धोखाधड़ी की चेतावनी प्राप्त कर रहा है।

नीचे दी गई तालिका बैच और वास्तविक समय प्रसंस्करण के बीच के अंतरों को सूचीबद्ध करती है -

बैच प्रसंस्करण वास्तविक समय प्रसंस्करण

स्थैतिक फ़ाइलें

इवेंट स्ट्रीम

समय-समय पर मिनट, घंटे, दिन आदि में संसाधित किया जाता है।

तुरंत कार्यवाही की गई

नैनोसेकंड

डिस्क भंडारण पर पिछले डेटा

मेमोरी स्टोरेज में

उदाहरण - बिल जनरेशन

उदाहरण - एटीएम ट्रांजेक्शन अलर्ट

इन दिनों, हर संगठन में वास्तविक समय प्रसंस्करण का बहुत उपयोग किया जा रहा है। धोखाधड़ी का पता लगाने, हेल्थकेयर में रीयल-टाइम अलर्ट और नेटवर्क अटैक अलर्ट जैसे मामलों का तत्काल डेटा के वास्तविक समय प्रसंस्करण की आवश्यकता होती है; कुछ मिलीसेकंड की देरी का भी बहुत बड़ा असर हो सकता है।

ऐसे वास्तविक समय के उपयोग के मामलों के लिए एक आदर्श उपकरण वह होगा, जो डेटा को स्ट्रीम के रूप में इनपुट कर सकता है और बैच को नहीं। Apache Flink वह रीयल-टाइम प्रोसेसिंग टूल है।