बिग डेटा क्या है?
बिग डेटा से तात्पर्य उन सूचनाओं के बड़े, विविध सेटों से है जो लगातार बढ़ती दरों पर बढ़ते हैं। इसमें सूचनाओं का वेग, गति या गति होती है, जिस पर इसे बनाया जाता है और एकत्र किया जाता है, और डेटा बिंदुओं की विविधता या दायरे को कवर किया जाता है। बिग डेटा अक्सर कई स्रोतों से आता है और कई प्रारूपों में आता है।
बिग डेटा कैसे काम करता है
बड़े डेटा को असंरचित या संरचित के रूप में वर्गीकृत किया जा सकता है। संरचित डेटा में पहले से ही डेटाबेस और स्प्रेडशीट में संगठन द्वारा प्रबंधित जानकारी होती है; यह प्रकृति में अक्सर संख्यात्मक होता है। असंरचित डेटा वह जानकारी है जो असंगठित है और पूर्व-निर्धारित मॉडल या प्रारूप में नहीं आती है। इसमें सोशल मीडिया स्रोतों से एकत्र किए गए डेटा शामिल हैं, जो संस्थानों को ग्राहकों की ज़रूरतों के बारे में जानकारी इकट्ठा करने में मदद करते हैं।
तीन बनाम पारंपरिक रूप से बड़े डेटा की विशेषता है: डेटा की मात्रा (राशि), वेग (गति) जिस पर इसे एकत्र किया जाता है, और जानकारी की विविधता।
सामाजिक नेटवर्क और वेबसाइटों पर सार्वजनिक रूप से साझा टिप्पणियों से बड़ा डेटा एकत्र किया जा सकता है, स्वैच्छिक रूप से व्यक्तिगत इलेक्ट्रॉनिक्स और ऐप से, प्रश्नावली, उत्पाद खरीद और इलेक्ट्रॉनिक चेक-इन के माध्यम से एकत्र किया जा सकता है। स्मार्ट उपकरणों में सेंसर और अन्य इनपुट की उपस्थिति से डेटा को स्थितियों और परिस्थितियों के व्यापक स्पेक्ट्रम में इकट्ठा किया जा सकता है।
बड़े डेटा को अक्सर कंप्यूटर डेटाबेस में संग्रहीत किया जाता है और विशेष रूप से बड़े, जटिल डेटा सेट को संभालने के लिए डिज़ाइन किए गए सॉफ़्टवेयर का उपयोग करके विश्लेषण किया जाता है। कई सॉफ्टवेयर-ए-सर्विस (सास) कंपनियां इस प्रकार के जटिल डेटा को प्रबंधित करने में विशेषज्ञ हैं।
बिग डेटा का उपयोग
डेटा विश्लेषक विभिन्न प्रकार के डेटा के बीच संबंध को देखते हैं, जैसे जनसांख्यिकीय डेटा और खरीद इतिहास, यह निर्धारित करने के लिए कि क्या सहसंबंध मौजूद है। ऐसे आकलन किसी कंपनी के भीतर या किसी तीसरे पक्ष द्वारा बाहरी रूप से किए जा सकते हैं जो बड़े डेटा को पचाने योग्य प्रारूपों में संसाधित करने पर ध्यान केंद्रित करते हैं। व्यवसाय अक्सर ऐसे विशेषज्ञों द्वारा बड़े डेटा के मूल्यांकन का उपयोग करके इसे कार्रवाई योग्य जानकारी में बदल देते हैं।
एक कंपनी में लगभग हर विभाग डेटा विश्लेषण से लेकर मानव संसाधन और प्रौद्योगिकी से लेकर विपणन और बिक्री तक के निष्कर्षों का उपयोग कर सकता है। बड़े डेटा का लक्ष्य उन उत्पादों की गति को बढ़ाना है, जिन पर उत्पादों को बाज़ार में लाया जाता है, ताकि बाज़ार अपनाने, लक्षित दर्शकों को प्राप्त करने के लिए आवश्यक समय और संसाधनों की मात्रा कम हो सके और यह सुनिश्चित हो सके कि ग्राहक संतुष्ट रहें।
चाबी छीन लेना
- बड़ा डेटा विविध सूचनाओं की एक बड़ी मात्रा है जो बढ़ते हुए संस्करणों में और कभी-कभी उच्च वेग के साथ आता है। लेकिन डेटा को संरचित किया जा सकता है (अक्सर संख्यात्मक, आसानी से स्वरूपित और संग्रहीत) या असंरचित (अधिक मुक्त-रूप, कम मात्रा में)। एक कंपनी में विभाग बड़े डेटा विश्लेषण से निष्कर्षों का उपयोग कर सकता है, लेकिन इसकी अव्यवस्था और शोर को संभालने से समस्याएं पैदा हो सकती हैं।
बड़े डेटा के लाभ और नुकसान
उपलब्ध आंकड़ों की मात्रा में वृद्धि दोनों अवसरों और समस्याओं को प्रस्तुत करती है।
सामान्य तौर पर, किसी के ग्राहकों (और संभावित ग्राहकों) पर अधिक डेटा होने से कंपनियों को अपने उत्पादों और विपणन प्रयासों को बेहतर ढंग से तैयार करने की अनुमति मिल सकती है ताकि उच्चतम स्तर की संतुष्टि और दोहराने के व्यवसाय का निर्माण हो सके। जो कंपनियां बड़ी मात्रा में डेटा एकत्र करने में सक्षम हैं, उन्हें गहन और समृद्ध विश्लेषण करने का अवसर प्रदान किया जाता है।
जबकि बेहतर विश्लेषण एक सकारात्मक है, बड़ा डेटा भी अधिभार और शोर पैदा कर सकता है। कंपनियों को डेटा के बड़े संस्करणों को संभालने में सक्षम होना चाहिए, सभी निर्धारित करते समय कि कौन सा डेटा शोर की तुलना में संकेतों का प्रतिनिधित्व करता है। यह निर्धारित करना कि डेटा को प्रासंगिक बनाने का एक महत्वपूर्ण कारक है।
इसके अलावा, डेटा की प्रकृति और प्रारूप को कार्य करने से पहले विशेष हैंडलिंग की आवश्यकता हो सकती है। सांख्यिक मूल्यों से मिलकर संरचित डेटा, आसानी से संग्रहीत और सॉर्ट किया जा सकता है। ईमेल, वीडियो और टेक्स्ट डॉक्यूमेंट जैसे अनस्ट्रक्चर्ड डेटा को उपयोगी बनने से पहले अधिक परिष्कृत तकनीकों को लागू करने की आवश्यकता हो सकती है।
