नमूना वितरण क्या है?
एक नमूना वितरण एक विशिष्ट आबादी से खींचे गए नमूनों की एक बड़ी संख्या के माध्यम से प्राप्त आंकड़ों का एक संभाव्यता वितरण है। दी गई जनसंख्या का नमूना वितरण विभिन्न परिणामों की एक आवृत्ति की आवृत्तियों का वितरण है जो संभवतः आबादी के आंकड़ों के लिए हो सकता है।
सैंपलिंग वितरण को समझना
शिक्षाविदों, सांख्यिकीविदों, शोधकर्ताओं, विपणक, विश्लेषकों, आदि द्वारा तैयार और उपयोग किए गए बहुत सारे डेटा वास्तव में नमूने हैं, आबादी नहीं। एक नमूना आबादी का एक सबसेट है। उदाहरण के लिए, एक मेडिकल रिसर्चर जो उत्तरी अमेरिका में पैदा हुए सभी शिशुओं के औसत वजन की तुलना 1995 से 2005 के बीच दक्षिण अमेरिका में पैदा हुए लोगों से करना चाहते थे, एक ही समय अवधि में एक उचित समय के भीतर पूरी आबादी के लिए डेटा नहीं बना सकते हैं। दस साल की समय सीमा में होने वाले एक लाख से अधिक प्रसव। इसके बजाय वह निष्कर्ष निकालने के लिए प्रत्येक महाद्वीप में केवल 100 शिशुओं के वजन का उपयोग करेगा। उपयोग किए गए 200 शिशुओं का वजन नमूना है और गणना की गई औसत वजन का नमूना है।
अब मान लीजिए कि प्रत्येक महाद्वीप से 100 नवजात वजन का सिर्फ एक नमूना लेने के बजाय, चिकित्सा शोधकर्ता सामान्य आबादी से बार-बार यादृच्छिक नमूने लेता है, और प्रत्येक नमूना समूह के लिए नमूना माध्य की गणना करता है। इसलिए, उत्तरी अमेरिका के लिए, वह अमेरिका, कनाडा और मैक्सिको में दर्ज 100 नवजात वजन के लिए डेटा खींचता है: अमेरिका के चुनिंदा अस्पतालों से चार 100 नमूने, कनाडा से पांच 70 नमूने और मेक्सिको से तीन 150 रिकॉर्ड, कुल के लिए 1200 वेट के नवजात शिशुओं को 12 सेटों में बांटा गया। वह दक्षिण अमेरिका में 12 देशों में से प्रत्येक से 100 जन्म के वजन का एक नमूना डेटा एकत्र करता है।
प्रत्येक नमूने का अपना नमूना मतलब होता है और नमूने के वितरण के नमूने के वितरण के रूप में जाना जाता है।
प्रत्येक नमूना सेट के लिए गणना की गई औसत वजन माध्य का नमूना वितरण है। सिर्फ एक नमूने से मत की गणना नहीं की जा सकती। अन्य आंकड़े, जैसे कि मानक विचलन, विचरण, अनुपात और श्रेणी की गणना नमूना डेटा से की जा सकती है। मानक विचलन और विचरण नमूना वितरण की परिवर्तनशीलता को मापते हैं।
एक जनसंख्या में टिप्पणियों की संख्या, एक नमूने में टिप्पणियों की संख्या और नमूना सेटों को खींचने के लिए उपयोग की जाने वाली प्रक्रिया एक नमूना वितरण की परिवर्तनशीलता निर्धारित करती है। नमूना वितरण के मानक विचलन को मानक त्रुटि कहा जाता है। जबकि नमूना वितरण का मतलब जनसंख्या के औसत के बराबर है, मानक त्रुटि जनसंख्या के मानक विचलन, जनसंख्या के आकार और नमूने के आकार पर निर्भर करती है।
यह जानना कि प्रत्येक सैम्पल सेट का माध्य एक दूसरे से कैसे फैलता है और जनसंख्या माध्य से यह संकेत मिलता है कि नमूना माध्य जनसंख्या माध्य के कितने समीप है। नमूना आकार बढ़ने पर नमूना वितरण की मानक त्रुटि कम हो जाती है।
विशेष ध्यान
एक आबादी या संख्याओं के एक नमूना सेट का एक सामान्य वितरण होगा। हालाँकि, क्योंकि एक नमूना वितरण में टिप्पणियों के कई सेट शामिल हैं, यह आवश्यक रूप से एक घंटी-घुमावदार आकार नहीं होगा।
हमारे उदाहरण के बाद, उत्तरी अमेरिका और दक्षिण अमेरिका में बच्चों का जनसंख्या औसत वजन सामान्य वितरण है क्योंकि कुछ बच्चे कम वजन वाले (औसत से नीचे) या अधिक वजन वाले (औसत से ऊपर), अधिकांश शिशुओं के बीच में (माध्य के आसपास) गिरते हैं।)। यदि उत्तरी अमेरिका में नवजात शिशुओं का औसत वजन सात पाउंड है, तो उत्तरी अमेरिका के लिए दर्ज किए गए नमूना टिप्पणियों के 12 सेटों में से प्रत्येक में नमूना औसत वजन सात पाउंड के करीब होगा।
हालाँकि, यदि आप 1, 200 नमूना समूहों में से प्रत्येक में गणना किए गए औसत में से प्रत्येक को ग्राफ़ करते हैं, तो परिणामस्वरूप आकार में एक समान वितरण हो सकता है, लेकिन यह निश्चित करना मुश्किल है कि वास्तविक आकार क्या होगा। एक लाख से अधिक वजन के आंकड़ों से शोधकर्ता जितने अधिक नमूनों का उपयोग करेगा, उतना ही अधिक ग्राफ एक सामान्य वितरण का निर्माण करना शुरू कर देगा।
- एक नमूना वितरण एक विशिष्ट आबादी से खींची गई बड़ी संख्या में नमूनों के माध्यम से प्राप्त सांख्यिकीय का एक संभाव्यता वितरण है। किसी दिए गए जनसंख्या का नमूना वितरण विभिन्न परिणामों की एक श्रृंखला की आवृत्तियों का वितरण है जो संभवतः एक आंकड़े के लिए हो सकता है। जनसंख्या। शिक्षाविदों, सांख्यिकीविदों, शोधकर्ताओं, विपणक और विश्लेषकों द्वारा उपयोग किए गए बहुत सारे डेटा वास्तव में नमूने हैं, आबादी नहीं।
