डेटा वेयरहाउसिंग क्या है?
डेटा वेयरहाउसिंग एक व्यवसाय या संगठन द्वारा बड़ी मात्रा में जानकारी का इलेक्ट्रॉनिक भंडारण है। डेटा वेयरहाउसिंग व्यापार खुफिया का एक महत्वपूर्ण घटक है जो व्यावसायिक डेटा पर विश्लेषणात्मक तकनीकों को नियुक्त करता है।
डेटा वेयरहाउसिंग की अवधारणा को 1988 में आईबीएम के शोधकर्ताओं बैरी देवलिन और पॉल मर्फी द्वारा प्रस्तुत किया गया था। वेयरहाउस डेटा की आवश्यकता विकसित हुई क्योंकि कंप्यूटर सिस्टम अधिक जटिल हो गए और डेटा की बढ़ती मात्रा को नियंत्रित किया। डेटा वेयरहाउसिंग की एक महत्वपूर्ण पुस्तक WH Inmon की "बिल्डिंग डेटाहाउस का निर्माण" है, जिसे पहली बार 1990 में प्रकाशित किया गया था और तब से कई बार पुनर्मुद्रित किया गया है।
डेटा वेयरहाउसिंग कैसे काम करता है
डेटा वेयरहाउसिंग का उपयोग किसी कंपनी के प्रदर्शन में कई विषम स्रोतों से समेकित डेटा की तुलना में अधिक जानकारी प्रदान करने के लिए किया जाता है। एक डेटा वेयरहाउस को लेन-देन स्रोतों से प्राप्त ऐतिहासिक डेटा पर क्वेरी और विश्लेषण चलाने के लिए डिज़ाइन किया गया है।
एक बार जब डेटा को वेयरहाउस में शामिल कर लिया जाता है, तो यह परिवर्तित नहीं होता है और इसे बदला नहीं जा सकता क्योंकि डेटा वेयरहाउस उन घटनाओं पर एनालिटिक्स चलाता है जो पहले से ही समय के साथ डेटा में बदलाव पर ध्यान केंद्रित करके हुए हैं। भण्डारित डेटा को सुरक्षित, विश्वसनीय, पुनर्प्राप्त करने में आसान और प्रबंधित करने में आसान तरीके से संग्रहीत किया जाना चाहिए।
कुछ निश्चित चरण हैं जो डेटा वेयरहाउस बनाने के लिए उठाए जाते हैं। पहला चरण डेटा निष्कर्षण है, जिसमें कई स्रोत बिंदुओं से बड़ी मात्रा में डेटा एकत्र करना शामिल है। डेटा संकलित किए जाने के बाद, यह डेटा की सफाई के माध्यम से जाता है, त्रुटियों के लिए डेटा के माध्यम से कंघी करने और पाई गई त्रुटियों को सुधारने या बाहर करने की प्रक्रिया।
साफ किया हुआ डेटा तब डेटाबेस फॉर्मेट से वेयरहाउस फॉर्मेट में बदल जाता है। एक बार जब यह गोदाम में संग्रहीत हो जाता है, तो डेटा छँटाई, समेकन, संक्षेपण आदि के माध्यम से जाता है, ताकि यह अधिक समन्वित और उपयोग करने में आसान हो। समय के साथ, गोदाम में अधिक डेटा जोड़ा जाता है क्योंकि कई डेटा स्रोत अपडेट किए जाते हैं।
चाबी छीन लेना
- डेटा वेयरहाउसिंग एक व्यवसाय या संगठन द्वारा बड़ी मात्रा में सूचनाओं का इलेक्ट्रॉनिक भंडारण है। डेटा वेयरहाउस को व्यापार खुफिया और डेटा खनन उद्देश्यों के लिए लेनदेन स्रोतों से प्राप्त ऐतिहासिक डेटा पर क्वेरी और विश्लेषण चलाने के लिए डिज़ाइन किया गया है। डेटा वेयरहाउसिंग का उपयोग अधिक प्रदान करने के लिए किया जाता है। कई विषम स्रोतों से समेकित डेटा की तुलना करके एक कंपनी के प्रदर्शन में अंतर्दृष्टि।
विशेष विचार: डाटा माइनिंग
व्यवसाय अन्वेषण और डेटा माइनिंग में उपयोग के लिए डेटा को वेयरहाउस कर सकते हैं, सूचना के पैटर्न की तलाश कर रहे हैं जो उन्हें अपनी व्यावसायिक प्रक्रियाओं को बेहतर बनाने में मदद करेगा। एक अच्छा डेटा वेयरहाउसिंग सिस्टम एक कंपनी के भीतर विभिन्न विभागों के लिए एक-दूसरे के डेटा तक पहुंचने में आसान बना सकता है।
उदाहरण के लिए, एक डेटा वेयरहाउस किसी कंपनी को बिक्री टीम के डेटा का आसानी से आकलन करने और बिक्री को बेहतर बनाने या विभाग को कारगर बनाने के बारे में निर्णय लेने में मदद कर सकता है। व्यवसाय अपने ग्राहकों की खर्च करने की आदतों पर ध्यान केंद्रित करके अपने उत्पादों की बेहतर स्थिति और बिक्री बढ़ाने का विकल्प चुन सकता है।
डेटा वेयरहाउसिंग के साथ, कंपनी अपने ग्राहकों के खर्च के ऐतिहासिक डेटा को इकट्ठा कर सकती है - 20 वर्षों में - और इस डेटा पर एनालिटिक्स चला सकती है। परिणामी जानकारी अपने उपभोक्ताओं की प्राथमिकताओं में अंतर्दृष्टि प्रदान कर सकती है; अधिक बिक्री के साथ दिन, महीने या वर्ष का समय; या वर्ष के लिए सबसे अधिक खर्च करने वाला ग्राहक।
प्रभावी डेटा संग्रहण और प्रबंधन भी वही है जो प्रक्रियाएं बनाता है, जैसे यात्रा आरक्षण आरंभ करना और स्वचालित टेलर मशीनों का उपयोग संभव है।
डेटा खनन प्रक्रिया पांच चरणों में टूट जाती है:
- संगठन डेटा एकत्र करते हैं और इसे अपने डेटा वेयरहाउस में लोड करते हैं। फिर वे डेटा को स्टोर करते हैं और इन-हाउस सर्वर या क्लाउड पर प्रबंधित करते हैं। व्यापार विश्लेषक, प्रबंधन टीम और सूचना प्रौद्योगिकी पेशेवर डेटा तक पहुंचते हैं और निर्धारित करते हैं कि वे इसे कैसे व्यवस्थित करना चाहते हैं। एप्लिकेशन सॉफ़्टवेयर तब उपयोगकर्ता के परिणामों के आधार पर डेटा को सॉर्ट करता है। एंड-यूज़र अंत में डेटा को एक आसान-से-शेयर प्रारूप में प्रस्तुत करता है, जैसे कि ग्राफ़ या तालिका।
डेटा भंडारण बनाम डेटाबेस
डेटा गोदाम आवश्यक रूप से मानक डेटाबेस के समान अवधारणा नहीं है। एक डेटाबेस एक ट्रांसेक्शनल सिस्टम है जो वास्तविक समय के डेटा को मॉनिटर करने और अपडेट करने के लिए सेट किया गया है ताकि केवल सबसे हाल का डेटा उपलब्ध हो सके। एक डेटा वेयरहाउस को समय-समय पर संरचित डेटा एकत्र करने के लिए प्रोग्राम किया जाता है। उदाहरण के लिए, एक डेटाबेस में केवल ग्राहक का सबसे हाल का पता हो सकता है, जबकि एक डेटा वेयरहाउस में वे सभी पते हो सकते हैं जो ग्राहक पिछले 10 वर्षों से रह रहे हैं।
