एक गैर-नमूनाकरण त्रुटि क्या है?
एक गैर-नमूनाकरण त्रुटि एक सांख्यिकीय शब्द है जो डेटा संग्रह के दौरान होने वाली त्रुटि को संदर्भित करता है, जिससे डेटा सही मानों से भिन्न होता है। एक गैर-नमूना त्रुटि एक नमूना त्रुटि से भिन्न होती है। एक नमूना त्रुटि नमूना मूल्यों और ब्रह्मांड मूल्यों के बीच किसी भी अंतर तक सीमित है जो कि नमूना आकार सीमित होने के कारण उत्पन्न होती है। (संपूर्ण ब्रह्मांड का सर्वेक्षण या जनगणना में नमूना नहीं लिया जा सकता है।)
चाबी छीन लेना
- गैर-सैंपलिंग त्रुटि आँकड़ों में प्रयुक्त एक शब्द है जो डेटा संग्रह के दौरान होने वाली त्रुटि को संदर्भित करता है, जिससे डेटा सही मानों से भिन्न होता है। एक गैर-सैंपलिंग त्रुटि या तो यादृच्छिक या व्यवस्थित त्रुटियों को संदर्भित करती है, और ये त्रुटियां एक सर्वेक्षण, नमूने, या जनगणना में स्पॉट करने के लिए चुनौतीपूर्ण हो सकती हैं। व्यवस्थित गैर-नमूनाकरण त्रुटियां यादृच्छिक गैर-नमूनाकरण त्रुटियों की तुलना में बदतर हैं क्योंकि व्यवस्थित त्रुटियों के परिणामस्वरूप अध्ययन, सर्वेक्षण या जनगणना हो सकती है। त्रुटियों की संख्या जितनी अधिक होगी, जानकारी उतनी ही कम विश्वसनीय होगी। गैर-नमूना त्रुटियां होने पर, एक अध्ययन या सर्वेक्षण में पूर्वाग्रह की दर बढ़ जाती है।
नमूनाकरण त्रुटि तब भी हो सकती है जब किसी भी प्रकार की कोई गलती नहीं की जाती है। "त्रुटियों" का परिणाम केवल इस तथ्य से है कि एक नमूना में डेटा ब्रह्मांड में डेटा से पूरी तरह से मेल खाने की संभावना नहीं है, जहां से नमूना लिया जाता है। नमूना आकार बढ़ाकर इस "त्रुटि" को कम से कम किया जा सकता है।
गैर-नमूनाकरण त्रुटियां अन्य सभी विसंगतियों को कवर करती हैं, जिनमें वे भी शामिल हैं जो खराब नमूना तकनीक से उत्पन्न होती हैं।
एक गैर-नमूनाकरण त्रुटि कैसे काम करती है
गैर-नमूनाकरण त्रुटियां नमूने और सेंसर दोनों में मौजूद हो सकती हैं, जिसमें पूरी आबादी का सर्वेक्षण किया जाता है। गैर-नमूनाकरण त्रुटियां दो श्रेणियों के अंतर्गत आती हैं: यादृच्छिक और व्यवस्थित।
माना जाता है कि यादृच्छिक त्रुटियों को एक-दूसरे को ऑफसेट करने के लिए माना जाता है और इसलिए, सबसे अधिक बार, थोड़ा चिंता का विषय है। दूसरी ओर, व्यवस्थित त्रुटियां पूरे नमूने को प्रभावित करती हैं और इसलिए अधिक महत्वपूर्ण मुद्दा प्रस्तुत करती हैं। यादृच्छिक त्रुटियों, आम तौर पर, एक नमूना या एक जनगणना को स्क्रैप करने में परिणाम नहीं होगा, जबकि एक व्यवस्थित त्रुटि सबसे अधिक संभावना है कि डेटा अनुपयोगी हो जाएगा।
गैर-नमूनाकरण त्रुटियां एक सर्वेक्षण, अध्ययन या जनगणना के भीतर एक मुद्दे के बजाय बाहरी कारकों के कारण होती हैं।
कई तरीके हैं जिनमें गैर-नमूनाकरण त्रुटियां हो सकती हैं। उदाहरण के लिए, गैर-नमूनाकरण त्रुटियों में शामिल हो सकते हैं, लेकिन डेटा प्रविष्टि त्रुटियों, पक्षपाती सर्वेक्षण प्रश्नों, पक्षपाती प्रसंस्करण / निर्णय लेने, गैर-प्रतिक्रियाएं, अनुचित विश्लेषण निष्कर्ष, और उत्तरदाताओं द्वारा प्रदान की गई झूठी जानकारी तक सीमित नहीं हैं।
विशेष ध्यान
सैंपल साइज बढ़ाने के दौरान सैंपलिंग की त्रुटियों को कम करने में मदद मिल सकती है, गैर-सैंपलिंग त्रुटियों को कम करने पर इसका कोई प्रभाव नहीं पड़ेगा। ऐसा इसलिए है क्योंकि गैर-नमूनाकरण त्रुटियों का पता लगाना अक्सर मुश्किल होता है, और उन्हें समाप्त करना लगभग असंभव है।
गैर-नमूना त्रुटियों में गैर-प्रतिक्रिया त्रुटियां, कवरेज त्रुटियां, साक्षात्कार त्रुटियां और प्रसंस्करण त्रुटियां शामिल हैं। एक कवरेज त्रुटि तब होगी, उदाहरण के लिए, यदि किसी व्यक्ति को एक सर्वेक्षण में दो बार गिना गया था, या उनके जवाबों को सर्वेक्षण पर दोहराया गया था। यदि एक साक्षात्कारकर्ता उनके नमूने में पक्षपाती है, तो गैर-नमूनाकरण त्रुटि को साक्षात्कारकर्ता त्रुटि माना जाएगा।
इसके अलावा, यह साबित करना मुश्किल है कि एक सर्वेक्षण में उत्तरदाता गलत जानकारी प्रदान कर रहे हैं - या तो गलती से या उद्देश्य पर। किसी भी तरह से, उत्तरदाताओं द्वारा प्रदान की गई गलत सूचना को गैर-नमूनाकरण त्रुटियों के रूप में गिना जाता है और उन्हें प्रतिक्रिया त्रुटियों के रूप में वर्णित किया जाता है।
तकनीकी त्रुटियां एक अलग श्रेणी में मौजूद हैं। यदि कोई डेटा-संबंधित प्रविष्टियाँ हैं - जैसे कि कोडिंग, संग्रह, प्रविष्टि, या संपादन - तो उन्हें प्रसंस्करण त्रुटियां माना जाता है।
