Definition of Apache Hadoop Framework in Hindi:- हडूप एक ओपन-सोर्स फ्रेमवर्क है, जिसे मूल रूप से बहुत अधिक मात्रा में डेटा का विश्लेषण करने के लिए विकसित किया गया है। इसे Apache कंपनी के द्वारा बनाया गया था, इसीलिए इसे कई बार आम बोलचाल की भाषा में अपाचे हडूप भी कहते हैं।
हडूप फ्रेमवर्क की सबसे बड़ी विशेषता यह है कि इसके मदद से हम एक साथ कई अलग-अलग कंप्यूटर मशीनों को जोड़कर उनमें डाटा संग्रहित कर सकते हैं और उन में जमा जानकारियों को समान रूप से संसाधित कर के उनका विश्लेषण भी कर सकते हैं। इसे Hadoop distributed file system (HDFS) के नाम से भी जाना जाता है क्योंकि ये मूल रूप से कई अलग-अलग कम्प्यूटरों में एक साथ मिलकर सूचनाओं को संगृहीत करने के लिए ही बनाया गया था।
Key Features of Hadoop in Hindi
Key Features of Hadoop in Hindi:- हडोप फ़ाइल सिस्टम की कुछ प्रमुख विशेषताएं निम्नलिखित रूप से है :-
- हडूप सॉफ्टवेयर फ्रेमवर्क को बनाने के लिए Java प्रोग्रामिंग लैंग्वेज का उपयोग किया गया है।
- यह ओपन-सोर्स फ्रेमवर्क है अर्थात कोई भी इसे मुफ़्त में डाउनलोड करके उपयोग कर सकता है।
- इसे मूलतः Big Data Analytics के काम को कम खर्चे और उच्च गति से करने के लिए बनाया गया है।
- यह हार्डवेयर की विफलता जैसी प्रतिकूल परिस्थितियों में डेटा हानि जैसे समस्या को हल करने में मदद करता है।
- यह अलग-अलग मशीनों पर फ़ाइल ब्लॉकों की प्रतिकृतियां बनाता है जिसके कारण अगर एक मशीन विफल विफल हो जाये तब भी दूसरे मशीनो में डेटा ब्लॉक सुरक्षित रहता है। इसी कारण हडूप को विश्वसनीय फ़ाइल सिस्टम माना जाता है।

History of Hadoop in Hindi:- हडूप फ्रेमवर्क की अवधारणा 2002 में Doug Cutting (डौग कटिंग) और Mike Cafarella (माइक कैफ़ेरेला) द्वारा की गई थी। 2002 में डौग कटिंग और माइक कैफ़ेरेला Apache Nutch नाम के एक ओपन सोर्स वेब क्रॉलर सॉफ्टवेयर प्रोजेक्ट पर काम कर रहे थे। इस प्रोजेक्ट पर काम करते समय उन्हें big data analytics से सम्बंदित समस्य उत्पन्न हुई क्योंकि उनके प्रोजेक्ट के दौरान बहुत अधिक मात्रा में डेटा इकट्ठा हो रहा था जिन्हें संसाधित करने के लिए उन्हें बहुत अधिक पैसे खर्च करने पर रहे थे। इसीलिए उन्होंने सोचा कि बिग डाटा को स्टोर करने के लिए उन्हें एक सिस्टम बनाना चाहिए जिसकी मदद से वह कम पैसे में ही डाटा को इकट्ठा कर सके और इस तरह हडूप फ्रेमवर्क की शुरुआत हुई।
डौग कटिंग के बेटे के पास एक प्लास्टिक का हाथी था जिसका नाम Hadoop था। इसी खिलौना के नाम पर उन्होंने इस फ्रेमवर्क का नाम हडूप रख दिया। हडूप फ्रेमवर्क के सबसे पहले संस्करण को एक April , 2006 को बाजार में प्रकाशित किया गया था। इसके बाद समय-समय पर इसमें कई अलग-अलग संशोधन किए गए। इसका सबसे नवीनतम तीसरा संस्करण 2017 में प्रकाशित किया गया था।
Advantages of Hadoop in Hindi
- Cost-effective:- अन्य सभी डेटा भंडारण प्रणाली की तुलना में हडोप अधिक सस्ता विकल्प है। इसे बिल्कुल मुफ़्त में डाउनलोड करके उपयोग किया जा सकता है और यह डेटा भंडारण के लिए सस्ती कमोडिटी हार्डवेयर मशीनें का उपयोग करती है। इसमें बड़ी आसानी से किसी नए मशीन को जोड़ा जा सकता है या किसी पुराने मशीन को खोलकर अलग किया जा सकता है। इसके साथ ही हडोप के नए संस्करण में डेटा को स्टोर करने के लिए कम मशीन की आवश्यकता होती है क्योंकि इसमें अनावश्यक डेटा में काफी कमी आई है। इन सब विशेषताओं के कारण हडोप को एक किफायती समाधान है माना जाता है।
- Ease of use:- हडोप फ्रेमवर्क को उपयोग करना बहुत ही सरल है। प्रोग्रामर को हडोप फ़ाइल सिस्टम से जुड़े हुए विभिन्न हार्डवेयर मशीनों के बारे में सोचने की कोई आवश्यकता नहीं होती, हडोप फ्रेमवर्क automatically सभी मशीनों के कार्य प्रणाली का ख़्याल रखता है । हडोप फ्रेमवर्क को उपयोग करना बहुत ही सरल है। प्रोग्रामर को हडोप फ़ाइल सिस्टम से जुड़े हुए विभिन्न हार्डवेयर मशीनों के बारे में सोचने की कोई आवश्यकता नहीं होती, हडोप फ्रेमवर्क automatically सभी मशीनों के कार्य प्रणाली का ख़्याल रखता है ।
- Scalable:- Hadoop एक स्केलेबल डेटा भंडारण प्लेटफॉर्म प्रदान करता है। इसमें नए मशीनों को सिस्टम के साथ जोड़ना तथा किसी पुराने मशीन को खोलकर अलग करने की प्रक्रिया बहुत ही सरल है और इससे मुख्य सॉफ्टवेयर सिस्टम किसी भी प्रकार से दुष्ट प्रभावित नहीं होता।
- Varied Data Sources:- इसके मदद से विभिन्न प्रकार के structured या unstructured डेटा को संग्रहित किया जा सकता है। इसमें टेक्स्ट फाइल, XML फाइल, इमेज, CSV फाइल आदि के रूप में डेटा को संग्रहित किया जा सकता है।
- Fast:- Hadoop की अनूठी संग्रहण पद्धति एक क्लस्टर के मदद से फ़ाइल में संग्रहित डेटा को मैप करता है। जिसके परिणामस्वरूप इसमें बहुत तेज़ी से डेटा प्रोसेसिंग होती है। हडोप में कई terabytes या TB unstructured data को मिनटों में संसाधित किया जा सकता है। इसकी गति के कारण बिजनेस ऑर्गेनाइजेशन में बिग डाटा एनालिटिक्स के लिए हडोप सबसे पहली पसंद है।
- Fault-Tolerant:- हडोप विभिन्न मशीनों में संगठित डाटा का एक कॉपी क्लस्टर नोड में संग्रहित रखता है, जिसके कारण किसी आपातकालीन स्थिति में अगर कोई एक मशीन खराब हो जाए तब भी उस मशीन में संग्रहित जानकारियां पहले से क्लस्टर नोड्स में सुरक्षित रहती है। जिसके कारण इससे एक विश्वसनीय डाटा संग्रहण माध्यम माना जाता है।
- Multiple Languages Supported:- यह सभी सॉफ्टवेयर इंजीनियर और डेवलपर्स को पूर्ण स्वतंत्रता प्रदान करते हैं कि वह हडोप फ्रेमवर्क के साथ C, C++, Perl, Python, Ruby, और Groovy जैसे किसी भी प्रोग्रामिंग लैंग्वेज का उपयोग अपनी जरुरत के अनुसार कर सकते है।
- Compatibility:- बिग डेटा के लिए उपयोग होने वाले सभी आधुनिक तकनीक जैसे कि Spark, Flink आदि हडोप फाइल सिस्टम के साथ बहुत ही बेहतर तरीके से काम करने में सक्षम है। इसी कारण Hadoop को डेटा स्टोरेज प्लेटफॉर्म के रूप में उपयोग करना बहुत ही आसान हो जाता हैं।
Disadvantages of Hadoop in Hindi
- Security Concerns:- हडूप का डिफ़ॉल्टका जटिल एप्लिकेशन के लिए जोखिम भरा हो सकता है क्योंकि इसमें स्टोरेज और नेटवर्क के स्तर पर एन्क्रिप्शन की सुबिधा नहीं है। हडूप को बनाने के लिए जावा प्रोग्रामिंग भाषा का उपयोग किया गया है। इसलिए साइबर अपराधियों इसे कई बार आसानी से Hack कर लेते है। इन्हीं कारणों से आमऔर पर हडूप फ़ाइल सिस्टम के साथ एक एक्सटर्नल फ़ाइल सिस्टम का उपयोग अनिवार्य रूप से किया जाता है।
- Not compatible With Small Data:- इससे मुख्य रूप से बहुत अधिक मात्रा में डाटा को संसाधित करने के लिए बनाया गया है, अगर डाटा की मात्रा कम हो तो उस प्रकार के जरूरतों के लिए यह अनुकूल नहीं हैं। Hadoop में डिफ़ॉल्ट रूप से ब्लॉक का आकार 128MB या 256MB का होता है जोकि किसी छोटी बिज़नेस ऑर्गनिगेशन की जरूरत से बहुत बड़ा है।
- Supports Only Batch Processing:- Hadoop में बैच प्रोसेसिंग इंजन का उपयोग किया गया है। यह तेजी से डेटा पर काम करता है, डेटा इकठा करने एवं उन्हें संसाधित करने के काम को बहुत जल्दी से पूरा कर सकता है लेकिन real-time में output नहीं दे सकता। real-time में जल्दी output के लिए स्ट्रीम प्रोसेसिंग की जरुरत होती है जिसका उपयोग हडूप में नहीं किया गया है।
- Stability Issues:- चूँकि हडूप एक ओपन सोर्स सॉफ्टवेयर है, इसी कारण किसी भी ओपन सोर्स सॉफ्टवेयर की तरह इसमें मौजूद किसी भी प्रकार के अस्थिरता के लिए कोई भी संस्था व्यक्तिगत तौर पर जिम्मेदारी लेने के लिए उपस्थित नहीं होगा। मान लीजिए कि भविष्य में हडूप फ्रेमवर्क में एक नया update आता है लेकिन उस अपडेट के बाद से सभी डेटाबेस में कोई समस्या पैदा हो जाती है तो उसे ठीक करने के लिए कोई भी व्यक्ति या संगठन निजी तौर पर जिम्मेदारी नहीं लेगा । इसी कारण आमतौर पर बिजनेस ऑर्गेनाइजेशन में ओपन सोर्स सॉफ्टवेयर का उपयोग नहीं किया जाता वह किसी निजी कंपनी द्वारा निर्मित उत्पाद को अधिक पसंद करते हैं।
Summery of Hadoop in Hindi:- समय के साथ-साथ डेटा विश्लेषण की प्रक्रिया काफी जटिल होते जा रही है, क्योंकि data का आकार बहुत बड़ा होते जा रहा है। इसलिए वह संगठन जो अपने संस्थान से संबंधित रोजमर्रा के डेटा को इकट्ठा करना चाहते हैं उन्हें एक ऐसे प्लेटफार्म की आवश्यकता हुई जिसके मदद से वह कई अलग-अलग मशीनों को एक साथ जोड़कर उनमें डाटा को इकट्ठा कर सके और उनका विश्लेषण कर सके। इसी जरुरत को पूरा करने के लिए अपाचे कंपनी ने हडूप फ्रेमवर्क का निर्माण किया। आज के समय में यह big data analytics के लिए सबसे ज्यादा उपयोग में लिया जाने वाला फ्रेमवर्क है।
इस लेख में हमने हडूप फ्रेमवर्क को सरल हिंदी भाषा में समझाने का प्रयास किया है। उम्मीद है कि Hadoop in Hindi का यह लेख आपको पसंद आया होगा। अगर आप Hadoop Framework पर लिखे गए इस लेख से संबंधित कोई सुझाव हमें देना चाहते हैं, तो नीचे कमेंट बॉक्स में लिखकर जरूर बताएं जिससे कि हम अपने लेख में आवश्यक परिवर्तन करके इसे और अधिक उपयोगी बना सके।
Leave a Reply