अपाचे तूफान - परिचय
अपाचे तूफान क्या है?
अपाचे स्टॉर्म एक वितरित वास्तविक समय की बड़ी डेटा-प्रोसेसिंग प्रणाली है। तूफान को बड़ी मात्रा में डेटा को एक दोष-सहिष्णु और क्षैतिज स्केलेबल विधि में संसाधित करने के लिए डिज़ाइन किया गया है। यह एक स्ट्रीमिंग डेटा फ्रेमवर्क है जिसमें उच्चतम अंतर्ग्रहण दर की क्षमता है। हालांकि स्टॉर्म स्टेटलेस है, यह अपाचे ज़ूकिपर के माध्यम से वितरित पर्यावरण और क्लस्टर राज्य का प्रबंधन करता है। यह सरल है और आप समानांतर में वास्तविक समय के डेटा पर सभी प्रकार के जोड़तोड़ कर सकते हैं।
अपाचे स्टॉर्म रियल-टाइम डेटा एनालिटिक्स में अग्रणी बना हुआ है। तूफान को सेटअप करना, संचालित करना आसान है और यह गारंटी देता है कि प्रत्येक संदेश को कम से कम एक बार टोपोलॉजी के माध्यम से संसाधित किया जाएगा।
अपाचे स्टॉर्म बनाम हैडोप
मूल रूप से Hadoop और Storm चौखटों का उपयोग बड़े डेटा के विश्लेषण के लिए किया जाता है। दोनों एक दूसरे के पूरक हैं और कुछ पहलुओं में भिन्न हैं। अपाचे स्टॉर्म दृढ़ता के अलावा सभी ऑपरेशन करता है, जबकि हडोप सब कुछ अच्छा है लेकिन वास्तविक समय की गणना में पिछड़ जाता है। निम्न तालिका स्टॉर्म और हडोप की विशेषताओं की तुलना करती है।
आंधी | Hadoop |
---|---|
वास्तविक समय धारा प्रसंस्करण | बैच प्रसंस्करण |
राज्यविहीन | स्टेटफुल |
ज़ूकेपर आधारित समन्वय के साथ मास्टर / दास वास्तुकला। मास्टर नोड के रूप में कहा जाता हैnimbus और गुलाम हैं supervisors। | ज़ूकेपर आधारित समन्वय के साथ मास्टर-दास वास्तुकला। मास्टर नोड हैjob tracker और दास नोड है task tracker। |
एक स्टॉर्म स्ट्रीमिंग प्रक्रिया, क्लस्टर पर प्रति सेकंड हजारों संदेशों तक पहुंच सकती है। | Hadoop डिस्ट्रिब्यूटेड फाइल सिस्टम (HDFS) बड़ी मात्रा में डेटा को संसाधित करने के लिए MapReduce फ्रेमवर्क का उपयोग करता है जिसमें मिनट या घंटे लगते हैं। |
तूफान टोपोलॉजी उपयोगकर्ता द्वारा बंद होने या एक अप्रत्याशित अप्राप्य विफलता तक चलता है। | MapReduce नौकरियों को एक अनुक्रमिक क्रम में निष्पादित किया जाता है और अंततः पूरा किया जाता है। |
Both are distributed and fault-tolerant | |
यदि निंबस / सुपरवाइजर की मृत्यु हो जाती है, तो पुनरारंभ करने से यह जारी रहता है कि यह कहाँ से रुका है, इसलिए कुछ भी प्रभावित नहीं होता है। | यदि JobTracker की मृत्यु हो जाती है, तो सभी चलने वाली नौकरियां खो जाती हैं। |
अपाचे तूफान के उपयोग-मामले
अपाचे स्टॉर्म रियल-टाइम बड़े डेटा स्ट्रीम प्रोसेसिंग के लिए बहुत प्रसिद्ध है। इस कारण से, अधिकांश कंपनियां स्टॉर्म को अपने सिस्टम के अभिन्न अंग के रूप में उपयोग कर रही हैं। कुछ उल्लेखनीय उदाहरण इस प्रकार हैं -
Twitter- ट्विटर "प्रकाशक विश्लेषिकी उत्पादों" की अपनी सीमा के लिए अपाचे स्टॉर्म का उपयोग कर रहा है। "प्रकाशक Analytics उत्पाद" ट्विटर प्लेटफ़ॉर्म में प्रत्येक ट्वीट और क्लिक को संसाधित करता है। अपाचे स्टॉर्म का ट्विटर इंफ्रास्ट्रक्चर से गहरा नाता है।
NaviSite- NaviSite इवेंट लॉग मॉनिटरिंग / ऑडिटिंग सिस्टम के लिए स्टॉर्म का उपयोग कर रहा है। सिस्टम में उत्पन्न हर लॉग स्टॉर्म से गुजरेगा। तूफान नियमित अभिव्यक्ति के कॉन्फ़िगर किए गए सेट के खिलाफ संदेश की जांच करेगा और यदि कोई मेल है, तो उस विशेष संदेश को डेटाबेस में सहेजा जाएगा।
Wego- वेगो सिंगापुर में स्थित एक यात्रा मेटासर्च इंजन है। यात्रा संबंधी डेटा दुनिया भर में कई स्रोतों से अलग-अलग समय के साथ आता है। तूफान वास्तविक समय के डेटा को खोजने के लिए वीगो की मदद करता है, समसामयिक मुद्दों को हल करता है और अंत-उपयोगकर्ता के लिए सबसे अच्छा मैच ढूंढता है।
अपाचे तूफान के फायदे
यहां उन लाभों की सूची दी गई है जो अपाचे स्टॉर्म प्रदान करते हैं -
तूफान खुला स्रोत, मजबूत और उपयोगकर्ता के अनुकूल है। इसका उपयोग छोटी कंपनियों के साथ-साथ बड़े निगमों में भी किया जा सकता है।
तूफान गलती सहिष्णु, लचीला, विश्वसनीय है, और किसी भी प्रोग्रामिंग भाषा का समर्थन करता है।
वास्तविक समय स्ट्रीम प्रसंस्करण की अनुमति देता है।
तूफान अविश्वसनीय रूप से तेज़ है क्योंकि इसमें डेटा को संसाधित करने की भारी शक्ति है।
रेखीय रूप से संसाधनों को जोड़कर बढ़ते लोड के तहत भी तूफान प्रदर्शन को बनाए रख सकता है। यह अत्यधिक स्केलेबल है।
तूफान सेकंड या मिनटों में डेटा रिफ्रेश और एंड-टू-एंड डिलीवरी प्रतिक्रिया करता है जो समस्या पर निर्भर करता है। इसकी बहुत कम विलंबता है।
तूफान में परिचालन बुद्धि होती है।
यदि क्लस्टर में कोई भी कनेक्टेड नोड्स मर जाते हैं या संदेश खो जाते हैं, तो भी स्टॉर्म गारंटी डेटा प्रोसेसिंग प्रदान करता है।