अपाचे फ्लिंक - वास्तुकला

अपाचे फ्लिंक कप्पा आर्किटेक्चर पर काम करता है। कप्पा वास्तुकला में एकल प्रोसेसर - स्ट्रीम है, जो सभी इनपुट को स्ट्रीम के रूप में मानता है और स्ट्रीमिंग इंजन वास्तविक समय में डेटा को संसाधित करता है। कप्पा वास्तुकला में बैच डेटा स्ट्रीमिंग का एक विशेष मामला है।

निम्नलिखित चित्र से पता चलता है Apache Flink Architecture

कप्पा वास्तुकला में मुख्य विचार एकल स्ट्रीम प्रोसेसिंग इंजन के माध्यम से बैच और वास्तविक समय डेटा दोनों को संभालना है।

अधिकांश बड़े डेटा फ्रेमवर्क लैम्बडा आर्किटेक्चर पर काम करते हैं, जिसमें बैच और स्ट्रीमिंग डेटा के लिए अलग-अलग प्रोसेसर होते हैं। लैम्ब्डा वास्तुकला में, आपके पास बैच और स्ट्रीम दृश्यों के लिए अलग-अलग कोडबेस हैं। क्वेरी करने और परिणाम प्राप्त करने के लिए, कोडबेस को विलय करने की आवश्यकता है। अलग-अलग कोडबेस / विचारों को बनाए रखना और उनका विलय करना एक पीड़ा है, लेकिन कप्पा आर्किटेक्चर इस मुद्दे को हल करता है क्योंकि इसमें केवल एक ही दृश्य है - वास्तविक समय, इसलिए कोडबेस के विलय की आवश्यकता नहीं है।

इसका मतलब यह नहीं है कि कप्पा वास्तुकला लैम्बडा आर्किटेक्चर की जगह लेती है, यह पूरी तरह से उपयोग-केस और एप्लिकेशन पर निर्भर करता है जो यह तय करता है कि कौन सा आर्किटेक्चर बेहतर होगा।

निम्नलिखित चित्र अपाचे फ्लिंक नौकरी निष्पादन वास्तुकला को दर्शाता है।

कार्यक्रम

यह कोड का एक टुकड़ा है, जिसे आप फ्लिंक क्लस्टर पर चलाते हैं।

ग्राहक

यह कोड (प्रोग्राम) लेने और जॉब डेटाफ्लो ग्राफ के निर्माण के लिए जिम्मेदार है, फिर उसे JobManager को पास करना है। यह नौकरी के परिणामों को भी पुनः प्राप्त करता है।

JobManager

क्लाइंट से जॉब डेटाफ्लो ग्राफ प्राप्त करने के बाद, यह निष्पादन ग्राफ बनाने के लिए जिम्मेदार है। यह कार्य प्रबंधक को कार्य क्लस्टर में असाइन करता है और कार्य के निष्पादन का पर्यवेक्षण करता है।

कार्य प्रबंधक

यह उन सभी कार्यों को निष्पादित करने के लिए जिम्मेदार है जिन्हें JobManager द्वारा सौंपा गया है। सभी कार्य प्रबंधक निर्दिष्ट समानता में अपने अलग-अलग स्लॉट में कार्यों को चलाते हैं। यह JobManager को कार्यों की स्थिति भेजने के लिए जिम्मेदार है।

Apache Flink की विशेषताएं

Apache Flink की विशेषताएं इस प्रकार हैं -

  • इसमें एक स्ट्रीमिंग प्रोसेसर है, जो बैच और स्ट्रीम प्रोग्राम दोनों चला सकता है।

  • यह तेज गति से बिजली की प्रक्रिया कर सकता है।

  • जावा, स्काला और पायथन में उपलब्ध एपीआई।

  • सभी सामान्य कार्यों के लिए एपीआई प्रदान करता है, जो प्रोग्रामर के लिए उपयोग करना बहुत आसान है।

  • कम विलंबता (नैनोसेकंड) और उच्च थ्रूपुट में डेटा संसाधित करता है।

  • इसका दोष सहिष्णु है। यदि कोई नोड, एप्लिकेशन या हार्डवेयर विफल होता है, तो यह क्लस्टर को प्रभावित नहीं करता है।

  • Apache Hadoop, Apache MapReduce, Apache Spark, HBase और अन्य बड़े डेटा टूल्स के साथ आसानी से एकीकृत कर सकते हैं।

  • बेहतर संगणना के लिए इन-मेमोरी मैनेजमेंट को कस्टमाइज़ किया जा सकता है।

  • यह अत्यधिक स्केलेबल है और क्लस्टर में हजारों नोड तक हो सकता है।

  • Apache Flink में विंडिंग बहुत लचीली होती है।

  • ग्राफ प्रोसेसिंग, मशीन लर्निंग, कॉम्प्लेक्स इवेंट प्रोसेसिंग लाइब्रेरी प्रदान करता है।