अपाचे NiFi - प्रोसेसर
Apache NiFi प्रोसेसर डेटा प्रवाह बनाने के बुनियादी ब्लॉक हैं। हर प्रोसेसर की अलग-अलग कार्यक्षमता होती है, जो आउटपुट फ्लोफाइल के निर्माण में योगदान देता है। नीचे दी गई छवि में दिखाया गया डेटाफ़्लो GetFile प्रोसेसर का उपयोग करके एक निर्देशिका से फ़ाइल ला रहा है और इसे PutFile प्रोसेसर का उपयोग करके किसी अन्य निर्देशिका में संग्रहीत कर रहा है।
दस्तावेज लें
GetFile प्रक्रिया का उपयोग किसी विशिष्ट निर्देशिका की विशिष्ट प्रारूप की फ़ाइलों को लाने के लिए किया जाता है। यह लाने पर अधिक नियंत्रण के लिए उपयोगकर्ता को अन्य विकल्प भी प्रदान करता है। हम नीचे गुण खंड में इस पर चर्चा करेंगे।
GetFile सेटिंग्स
GetFile प्रोसेसर की विभिन्न सेटिंग्स निम्नलिखित हैं -
नाम
नाम सेटिंग में, एक उपयोगकर्ता प्रोजेक्ट के अनुसार या उसके द्वारा प्रोसेसर के लिए किसी भी नाम को परिभाषित कर सकता है, जिससे नाम अधिक सार्थक हो जाता है।
सक्षम
एक उपयोगकर्ता इस सेटिंग का उपयोग करके प्रोसेसर को सक्षम या अक्षम कर सकता है।
जुर्माना अवधि
यह सेटिंग किसी उपयोगकर्ता को फ़्लोफ़ाइल विफलता की स्थिति में पेनल्टी समय अवधि को जोड़ने की अनुमति देती है।
उपज अवधि
प्रोसेसर के लिए उपज समय निर्दिष्ट करने के लिए इस सेटिंग का उपयोग किया जाता है। इस अवधि में, प्रक्रिया फिर से निर्धारित नहीं है।
बुलेटिन स्तर
इस सेटिंग का उपयोग उस प्रोसेसर के लॉग स्तर को निर्दिष्ट करने के लिए किया जाता है।
स्वचालित रूप से संबंध समाप्त करें
इसमें उस विशेष प्रक्रिया के सभी उपलब्ध संबंधों की जांच की एक सूची है। बक्से की जांच करके, एक उपयोगकर्ता प्रोसेसर को उस घटना पर प्रवाह को समाप्त करने के लिए प्रोग्राम कर सकता है और इसे प्रवाह में आगे नहीं भेज सकता है।
GetFile निर्धारण
ये GetFile प्रोसेसर द्वारा दिए गए निम्न शेड्यूलिंग विकल्प हैं -
अनुसूची की रणनीति
आप या तो समय के आधार पर प्रक्रिया को समय के आधार पर या एक CRON ड्राइवर विकल्प का चयन करके एक निर्दिष्ट CRON स्ट्रिंग का चयन करके निर्धारित कर सकते हैं।
समवर्ती कार्य
इस प्रोसेसर के लिए समवर्ती कार्य अनुसूची को परिभाषित करने के लिए इस विकल्प का उपयोग किया जाता है।
क्रियान्वयन
उपयोगकर्ता इस विकल्प का उपयोग करके सभी नोड्स में या केवल प्राथमिक नोड में प्रोसेसर को चलाने के लिए परिभाषित कर सकता है।
शेड्यूल चलाएं
इसका उपयोग समय चालित रणनीति या CRON संचालित रणनीति के लिए CRON अभिव्यक्ति के समय को परिभाषित करने के लिए किया जाता है।
GetFile गुण
GetFile कई गुणों को प्रदान करता है जैसा कि इमेज में दिखाए गए अनिवार्य गुण जैसे इनपुट डायरेक्टरी और फ़ाइल फ़िल्टर जैसे वैकल्पिक गुण जैसे पथ फ़िल्टर और अधिकतम फ़ाइल आकार। एक उपयोगकर्ता इन गुणों का उपयोग करके फ़ाइल लाने की प्रक्रिया का प्रबंधन कर सकता है।
GetFile टिप्पणियाँ
इस खंड का उपयोग प्रोसेसर के बारे में किसी भी जानकारी को निर्दिष्ट करने के लिए किया जाता है।
PutFile
पुटफ़ाइल प्रोसेसर का उपयोग डेटा प्रवाह से फ़ाइल को किसी विशिष्ट स्थान पर संग्रहीत करने के लिए किया जाता है।
PutFile सेटिंग्स
PutFile प्रोसेसर में निम्नलिखित सेटिंग्स हैं -
नाम
नाम सेटिंग में, उपयोगकर्ता प्रोजेक्ट के अनुसार या इसके द्वारा प्रोसेसर के लिए किसी भी नाम को परिभाषित कर सकता है, जिससे नाम अधिक सार्थक हो जाता है।
सक्षम
एक उपयोगकर्ता इस सेटिंग का उपयोग करके प्रोसेसर को सक्षम या अक्षम कर सकता है।
जुर्माना अवधि
यह सेटिंग फ़्लोफ़ाइल विफलता की स्थिति में उपयोगकर्ता को पेनल्टी टाइम की अवधि जोड़ देता है।
उपज अवधि
प्रोसेसर के लिए उपज समय निर्दिष्ट करने के लिए इस सेटिंग का उपयोग किया जाता है। इस अवधि में, प्रक्रिया फिर से निर्धारित नहीं होती है।
बुलेटिन स्तर
इस सेटिंग का उपयोग उस प्रोसेसर के लॉग स्तर को निर्दिष्ट करने के लिए किया जाता है।
स्वचालित रूप से संबंध समाप्त करें
इस सेटिंग्स में उस विशेष प्रक्रिया के सभी उपलब्ध संबंधों की जांच की एक सूची है। बक्से की जांच करके, उपयोगकर्ता उस घटना पर प्रवाह को समाप्त करने के लिए प्रोसेसर को प्रोग्राम कर सकता है और इसे प्रवाह में आगे नहीं भेज सकता है।
PutFile निर्धारण
ये निम्न शेड्यूलिंग विकल्प हैं, जो PutFile प्रोसेसर द्वारा पेश किए गए हैं -
अनुसूची की रणनीति
आप समय के आधार पर प्रक्रिया को समय-समय पर या तो टाइमर चालित या एक निर्दिष्ट CRON स्ट्रिंग का चयन करके CRON ड्राइवर विकल्प का चयन करके कर सकते हैं। एक प्रायोगिक रणनीति इवेंट ड्रिवेन भी है, जो एक विशिष्ट घटना पर प्रोसेसर को ट्रिगर करेगा।
समवर्ती कार्य
इस प्रोसेसर के लिए समवर्ती कार्य अनुसूची को परिभाषित करने के लिए इस विकल्प का उपयोग किया जाता है।
क्रियान्वयन
एक उपयोगकर्ता परिभाषित कर सकता है कि क्या इस विकल्प का उपयोग करके प्रोसेसर को सभी नोड्स में या केवल प्राथमिक नोड में चलाया जा सकता है।
शेड्यूल चलाएं
इसका उपयोग टाइमर चालित रणनीति या CRON संचालित रणनीति के लिए CRON अभिव्यक्ति के समय को परिभाषित करने के लिए किया जाता है।
PutFile गुण
पुटफाइल प्रोसेसर फाइल ट्रांसफर के उद्देश्य से आउटपुट डायरेक्टरी को निर्दिष्ट करने के लिए डायरेक्टरी जैसे गुण प्रदान करता है और अन्य ट्रांसफर को प्रबंधित करने के लिए जैसा कि नीचे की छवि में दिखाया गया है।
PutFile टिप्पणियाँ
इस खंड का उपयोग प्रोसेसर के बारे में किसी भी जानकारी को निर्दिष्ट करने के लिए किया जाता है।