Hadoop - बिग डेटा सॉल्यूशंस

परंपरागत दृष्टिकोण

इस दृष्टिकोण में, एक उद्यम के पास बड़े डेटा को संग्रहीत और संसाधित करने के लिए एक कंप्यूटर होगा। भंडारण उद्देश्य के लिए, प्रोग्रामर डेटाबेस विक्रेताओं की अपनी पसंद जैसे ओरेकल, आईबीएम इत्यादि की मदद लेंगे। इस दृष्टिकोण में, उपयोगकर्ता एप्लिकेशन के साथ इंटरैक्ट करता है, जो बदले में डेटा स्टोरेज और विश्लेषण के हिस्से को संभालता है।

परिसीमन

यह दृष्टिकोण उन अनुप्रयोगों के साथ ठीक काम करता है जो कम स्वैच्छिक डेटा को संसाधित करते हैं जिन्हें मानक डेटाबेस सर्वर द्वारा समायोजित किया जा सकता है, या डेटा को संसाधित करने वाले प्रोसेसर की सीमा तक। लेकिन जब भारी मात्रा में स्केलेबल डेटा से निपटने की बात आती है, तो एक एकल डेटाबेस अड़चन के माध्यम से ऐसे डेटा को संसाधित करना एक व्यस्त कार्य है।

Google का समाधान

Google ने MapReduce नामक एल्गोरिथम का उपयोग करके इस समस्या को हल किया। यह एल्गोरिदम कार्य को छोटे भागों में विभाजित करता है और उन्हें कई कंप्यूटरों को सौंपता है, और उनसे परिणाम एकत्र करता है जो एकीकृत होने पर परिणाम डेटासेट बनाते हैं।

Hadoop

Google द्वारा प्रदान किए गए समाधान का उपयोग करना, Doug Cutting और उनकी टीम ने एक Open Source Project नाम विकसित किया HADOOP

Hadoop MapReduce एल्गोरिदम का उपयोग करके एप्लिकेशन चलाता है, जहां डेटा को दूसरों के साथ समानांतर में संसाधित किया जाता है। संक्षेप में, Hadoop का उपयोग उन अनुप्रयोगों को विकसित करने के लिए किया जाता है जो बड़ी मात्रा में डेटा पर पूर्ण सांख्यिकीय विश्लेषण कर सकते हैं।