सरल यादृच्छिक बनाम स्तरीकृत यादृच्छिक नमूना: एक अवलोकन
सरल यादृच्छिक नमूने और स्तरीकृत यादृच्छिक नमूने दोनों सांख्यिकीय माप उपकरण हैं। संपूर्ण डेटा आबादी का प्रतिनिधित्व करने के लिए एक सरल यादृच्छिक नमूना का उपयोग किया जाता है। एक स्तरीकृत यादृच्छिक नमूना जनसंख्या को छोटे समूहों में विभाजित करता है, या साझा विशेषताओं के आधार पर स्ट्रेटा।
जनसंख्या टिप्पणियों या डेटा का कुल समूह है। एक नमूना आबादी से टिप्पणियों का एक सेट है। नमूनाकरण विधि वह प्रक्रिया है जिसका उपयोग जनसंख्या से नमूने खींचने के लिए किया जाता है।
सरल यादृच्छिक नमूना
सरल यादृच्छिक नमूनाकरण एक सांख्यिकीय उपकरण है जिसका उपयोग डेटा आबादी से लिए गए एक बहुत ही बुनियादी नमूने का वर्णन करने के लिए किया जाता है। यह नमूना पूरी आबादी के बराबर का प्रतिनिधित्व करता है।
साधारण यादृच्छिक नमूने का उपयोग अक्सर तब किया जाता है जब डेटा आबादी के बारे में बहुत कम जानकारी उपलब्ध होती है, जब डेटा आबादी में विभिन्न उप-भागों में विभाजित करने के लिए बहुत अधिक अंतर होते हैं, या जब डेटा आबादी के बीच केवल एक अलग विशेषता होती है।
उदाहरण के लिए, एक कैंडी कंपनी अपने उत्पाद लाइन के भविष्य का निर्धारण करने के लिए अपने ग्राहकों की खरीद की आदतों का अध्ययन करना चाह सकती है। यदि 10, 000 ग्राहक हैं, तो यह उन 100 ग्राहकों को यादृच्छिक नमूने के रूप में चुन सकता है। यह तब लागू हो सकता है जो इसे उन 100 ग्राहकों से इसके आधार के बाकी हिस्सों में पाता है।
सांख्यिकीविद् डेटा आबादी की एक विस्तृत सूची तैयार करेंगे और फिर उस बड़े समूह के भीतर एक यादृच्छिक नमूने का चयन करेंगे। इस नमूने में, जनसंख्या के प्रत्येक सदस्य को नमूने का हिस्सा बनने के लिए चुने जाने की समान संभावना है। उन्हें दो तरीकों से चुना जा सकता है:
- एक मैनुअल लॉटरी के माध्यम से, जिसमें आबादी के प्रत्येक सदस्य को एक नंबर दिया जाता है। फिर नमूने में किसी को शामिल करने के लिए संख्याओं को यादृच्छिक रूप से तैयार किया जाता है। एक छोटे समूह को देखते हुए इसका सबसे अच्छा उपयोग किया जाता है। कंप्यूटर-जनरेटेड सैम्पलिंग। यह विधि मानव के बजाय नमूनों का चयन करने के लिए कंप्यूटर का उपयोग करके, बड़े डेटा सेट के साथ सबसे अच्छा काम करती है।
सरल यादृच्छिक नमूने का उपयोग करना शोधकर्ताओं को एक विशिष्ट आबादी के बारे में सामान्यीकरण करने और किसी भी पूर्वाग्रह को छोड़ने की अनुमति देता है। यह भविष्य के निर्णय लेने के तरीके को निर्धारित करने में मदद कर सकता है। ताकि ऊपर के उदाहरण से कैंडी कंपनी इस उपकरण का उपयोग 100 ग्राहकों के वर्तमान स्वाद के आधार पर एक नया कैंडी स्वाद विकसित करने के लिए कर सके। लेकिन ध्यान रखें, ये सामान्यीकरण हैं, इसलिए त्रुटि के लिए जगह है। आखिरकार, यह एक सरल नमूना है। उन 100 ग्राहकों के पास पूरी आबादी के स्वाद का सटीक प्रतिनिधित्व नहीं हो सकता है।
स्तरीय अनियमित नमूने का चुनाव
सरल यादृच्छिक नमूनों के विपरीत, स्तरीकृत यादृच्छिक नमूनों का उपयोग आबादी के साथ किया जाता है जो आसानी से अलग-अलग उपसमूहों या सबसेट में टूट सकते हैं। ये समूह कुछ मानदंडों पर आधारित होते हैं, फिर समूह के आकार बनाम जनसंख्या के अनुपात में प्रत्येक से यादृच्छिक रूप से तत्वों का चयन करते हैं।
सैंपलिंग की इस विधि का मतलब है कि प्रत्येक अलग समूह से चयन होगा- जिसका आकार पूरी आबादी के अनुपात पर आधारित है। लेकिन शोधकर्ताओं को यह सुनिश्चित करना चाहिए कि स्ट्रैट ओवरलैप न करें। जनसंख्या में प्रत्येक बिंदु को केवल एक स्तर से संबंधित होना चाहिए ताकि प्रत्येक बिंदु पारस्परिक रूप से अनन्य हो। ओवरलैपिंग स्ट्रैटा की संभावना बढ़ जाती है कि कुछ डेटा शामिल हैं, इस प्रकार नमूना तिरछा करना।
कैंडी कंपनी अपने 100 ग्राहकों को विभिन्न आयु समूहों में विभाजित करके यादृच्छिक स्तरीकृत नमूनाकरण विधि का उपयोग करने का निर्णय ले सकती है ताकि इसके उत्पादन के भविष्य के बारे में निर्णय लेने में मदद मिल सके।
पोर्टफोलियो मैनेजर स्ट्रेंथेड रैंडम सैंपलिंग का इस्तेमाल बॉन्ड इंडेक्स जैसे इंडेक्स की नकल करके पोर्टफोलियो बनाने में कर सकते हैं।
स्तरीकृत नमूनाकरण सरल यादृच्छिक नमूने की तुलना में कुछ फायदे और नुकसान प्रदान करता है। क्योंकि यह विशिष्ट विशेषताओं का उपयोग करता है, यह जनसंख्या का अधिक सटीक प्रतिनिधित्व प्रदान कर सकता है जो कि इसे अलग-अलग सबसेट में विभाजित करने के लिए उपयोग किया जाता है। इसके लिए अक्सर एक छोटे नमूने के आकार की आवश्यकता होती है, जो संसाधनों और समय को बचा सकता है। इसके अलावा, प्रत्येक स्ट्रैटम से पर्याप्त नमूना बिंदुओं को शामिल करके, शोधकर्ता प्रत्येक व्यक्ति स्ट्रैटम पर एक अलग विश्लेषण कर सकते हैं।
लेकिन एक यादृच्छिक नमूने की तुलना में एक स्तरीकृत नमूने को खींचने के लिए अधिक काम की आवश्यकता होती है। शोधकर्ताओं को व्यक्तिगत रूप से शामिल करने के लिए प्रत्येक स्ट्रैटम के लिए डेटा को ट्रैक और सत्यापित करना चाहिए, जो यादृच्छिक नमूनाकरण की तुलना में बहुत अधिक समय ले सकता है।
चाबी छीन लेना
- सरल यादृच्छिक और स्तरीकृत यादृच्छिक नमूने सांख्यिकीय माप उपकरण हैं। सरल यादृच्छिक नमूना पूरे डेटा सेट का प्रतिनिधित्व करने के लिए पूरी आबादी का एक छोटा, बुनियादी हिस्सा लेता है। जनसंख्या को अलग-अलग समूहों में विभाजित किया जाता है जो समान विशेषताओं को साझा करते हैं, जिसमें से एक स्तरीकृत यादृच्छिक नमूना लिया जाता है।
