अपाचे NiFi - प्रोसेसर वर्गीकरण
इस अध्याय में, हम Apache NiFi में प्रक्रिया वर्गीकरण पर चर्चा करेंगे।
डेटा अंतर्ग्रहण प्रोसेसर
Data Ingestion श्रेणी के तहत प्रोसेसर का उपयोग NiFi डेटा प्रवाह में डेटा को निगलना के लिए किया जाता है। ये मुख्य रूप से Apache NiFi में किसी भी डेटा फ्लो का शुरुआती बिंदु हैं। कुछ प्रोसेसर जो इन श्रेणियों से संबंधित हैं, वे हैं GetFile, GetHTTP, GetFTP, GetKAFKA, आदि।
रूटिंग और मध्यस्थता प्रोसेसर
रूटिंग और मध्यस्थता प्रोसेसर का उपयोग फ्लोफाइल्स को अलग-अलग प्रोसेसर या डेटा प्रवाह के लिए उन फ्लोइलाइल्स की विशेषताओं या सामग्री में जानकारी के लिए किया जाता है। ये प्रोसेसर NiFi डेटा प्रवाह को नियंत्रित करने के लिए भी जिम्मेदार हैं। कुछ प्रोसेसर जो इस श्रेणी से संबंधित हैं, वो हैं रूटऑनअब्रिट, रूटऑन कॉन्टेंट, कंट्रोलरेट, रूटटेक्स्ट इत्यादि।
डेटाबेस एक्सेस प्रोसेसर
इस डेटाबेस एक्सेस श्रेणी के प्रोसेसर डेटा का चयन करने या सम्मिलित करने या डेटाबेस से अन्य एसक्यूएल स्टेटमेंट तैयार करने या तैयार करने में सक्षम हैं। ये प्रोसेसर मुख्य रूप से Apache NiFi के डेटा कनेक्शन पूल कंट्रोलर सेटिंग का उपयोग करते हैं। इस श्रेणी से संबंधित प्रोसेसर में से कुछ ExecuteSQL, PutSQL, PutDatabaseRecord, ListDatabaseWables, आदि हैं।
एट्रैक्शन प्रोसेसर्स को अट्रैक्ट करें
एट्रिब्यूशन एक्सट्रैक्टर प्रोसेसर एनआईएफआई डेटा प्रवाह में फ्लोफाइल विशेषताओं के प्रसंस्करण को निकालने, विश्लेषण करने, बदलने के लिए जिम्मेदार हैं। कुछ प्रोसेसर जो इस श्रेणी से संबंधित हैं, वे हैं अपडेटअट्रीब्यूट, एवोल्यूशनजॉनसपैथ, एक्सट्रैक्टटेक्स्ट, एट्रीब्यूट्सटोजोन, आदि।
सिस्टम इंटरेक्शन प्रोसेसर
सिस्टम इंटरेक्शन प्रोसेसर का उपयोग किसी भी ऑपरेटिंग सिस्टम में प्रोसेस या कमांड चलाने के लिए किया जाता है। ये प्रोसेसर कई भाषाओं में विभिन्न प्रकार की प्रणालियों के साथ बातचीत करने के लिए स्क्रिप्ट भी चलाते हैं। इस श्रेणी से संबंधित प्रोसेसर में से कुछ ExecuteScript, ExecuteProcess, ExecuteGroovyScript, ExecuteStreamCommand, आदि हैं।
डेटा ट्रांसफ़ॉर्मेशन प्रोसेसर्स
डेटा परिवर्तन से संबंधित प्रोसेसर फ़्लोफ़ाइल्स की सामग्री को बदलने में सक्षम हैं। इनका उपयोग आम तौर पर उपयोग किए जाने वाले फ्लोफाइल के डेटा को पूरी तरह से बदलने के लिए किया जा सकता है जब किसी उपयोगकर्ता को इनवॉल्ट करने के लिए HTTP बॉडी के रूप में फ्लोफाइल भेजना होता है। कुछ प्रोसेसर जो इस श्रेणी के हैं, रिप्लेसटेक्स्ट, जोल्ट्रांसफॉर्मफॉर्मजोन आदि हैं।
डाटा प्रोसेसर्स भेजना
डेटा प्रोसेसर्स भेजना आमतौर पर डेटा प्रवाह में अंतिम प्रोसेसर होता है। ये प्रोसेसर गंतव्य सर्वर पर डेटा संग्रहीत या भेजने के लिए जिम्मेदार हैं। सफल भंडारण या डेटा भेजने के बाद, ये प्रोसेसर सफलता के रिश्ते के साथ प्रवाह को प्रभावित करते हैं। कुछ प्रोसेसर जो इस श्रेणी से संबंधित हैं, वे हैं पुटमेल, पुटकाफका, पुटसफटीपी, पुटफाइल, पुटटीपी, आदि।
विभाजन और एकत्रीकरण प्रोसेसर
इन प्रोसेसर का उपयोग फ्लोफाइल में मौजूद सामग्री को विभाजित और विलय करने के लिए किया जाता है। इस श्रेणी से संबंधित कुछ प्रोसेसर स्प्लिटटेक्स्ट, स्प्लिटजॉन, स्प्लिटएक्सएल्एम, मर्जकॉन्टेंट, स्प्लिटकॉन्ट्रेंट, आदि हैं।
HTTP प्रोसेसर
ये प्रोसेसर HTTP और HTTPS कॉल के साथ सौदा करते हैं। कुछ प्रोसेसर जो इस श्रेणी के हैं, वे हैं इनवोकएचटीपी, पोस्टएचटीपी, लिसनएचटीपी, आदि।
AWS प्रोसेसर
AWS प्रोसेसर अमेज़न वेब सेवा प्रणाली के साथ बातचीत के लिए जिम्मेदार हैं। इस श्रेणी से संबंधित कुछ प्रोसेसर GetSQS, PutSNS, PutS3Object, FetchS3Object, आदि हैं।