विषय - सूची
- टी-टेस्ट क्या है?
- टी-टेस्ट के बारे में बताते हुए
- अस्पष्ट परीक्षण के परिणाम
- टी-टेस्ट मान्यताओं
- टी-टेस्ट की गणना
- सहसंबंधित (या जोड़ीदार) टी-टेस्ट
- समान भिन्न (तालित) टी-टेस्ट
- असमान विर्सजन टी-टेस्ट
- किस टी-टेस्ट का उपयोग करने के लिए निर्धारित करना
- असमान विविधता टी टेस्ट उदाहरण
टी-टेस्ट क्या है?
एक टी-टेस्ट एक प्रकार का अनुमानात्मक आँकड़ा है जो यह निर्धारित करने के लिए उपयोग किया जाता है कि क्या दो समूहों के साधनों के बीच एक महत्वपूर्ण अंतर है, जो कुछ विशेषताओं में संबंधित हो सकता है। इसका उपयोग ज्यादातर तब किया जाता है जब डेटा सेट, जैसे कि डेटा सेट को 100 बार सिक्का उछालने के परिणाम के रूप में दर्ज किया जाता है, एक सामान्य वितरण का पालन करेगा और इसमें अज्ञात परिवर्तन हो सकते हैं। एक टी-टेस्ट का उपयोग एक परिकल्पना परीक्षण उपकरण के रूप में किया जाता है, जो आबादी पर लागू धारणा का परीक्षण करने की अनुमति देता है।
एक टी-टेस्ट, टी-स्टेटिस्टिक, टी-डिस्ट्रीब्यूशन वैल्यूज़ और फ्रीडम की डिग्रियों को डेटा के दो सेटों के बीच अंतर की संभावना को देखने के लिए देखता है। तीन या अधिक चरों के साथ परीक्षण करने के लिए, किसी को विचरण के विश्लेषण का उपयोग करना चाहिए।
टी टेस्ट
टी-टेस्ट के बारे में बताते हुए
अनिवार्य रूप से, एक टी-टेस्ट हमें दो डेटा सेटों के औसत मूल्यों की तुलना करने और यह निर्धारित करने की अनुमति देता है कि क्या वे एक ही आबादी से आए हैं। उपरोक्त उदाहरणों में, यदि हम कक्षा A के छात्रों का एक नमूना लेते हैं और कक्षा B के छात्रों का एक और नमूना लेते हैं, तो हम उनसे बिल्कुल यही मतलब और मानक विचलन नहीं लेंगे। इसी तरह, प्लेसबो-फ़ेड कंट्रोल ग्रुप से लिए गए नमूने और दवा निर्धारित समूह से लिए गए नमूनों का थोड़ा अलग मतलब और मानक विचलन होना चाहिए।
गणितीय रूप से, टी-टेस्ट दो सेटों में से प्रत्येक से एक नमूना लेता है और एक शून्य परिकल्पना मानकर समस्या कथन को स्थापित करता है कि दोनों साधन समान हैं। लागू फ़ार्मुलों के आधार पर, कुछ मानों की गणना और मानक मानों की तुलना में की जाती है, और मान ली गई अशक्त परिकल्पना को स्वीकार या अस्वीकार कर दिया जाता है।
यदि अशक्त परिकल्पना खारिज होने के योग्य है, तो यह इंगित करता है कि डेटा रीडिंग मजबूत हैं और संयोग से नहीं हैं। टी-टेस्ट इस उद्देश्य के लिए उपयोग किए जाने वाले कई परीक्षणों में से एक है। सांख्यिकीविदों को बड़े नमूने आकारों के साथ अधिक चर और परीक्षणों की जांच करने के लिए टी-टेस्ट के अलावा अन्य परीक्षणों का उपयोग करना चाहिए। एक बड़े नमूने के आकार के लिए, सांख्यिकीविद् एक जेड-परीक्षण का उपयोग करते हैं। अन्य परीक्षण विकल्पों में ची-स्क्वायर टेस्ट और एफ-टेस्ट शामिल हैं।
तीन प्रकार के टी-टेस्ट हैं, और उन्हें आश्रित और स्वतंत्र टी-टेस्ट के रूप में वर्गीकृत किया गया है।
चाबी छीन लेना
- एक टी-टेस्ट एक प्रकार का अनुमानात्मक आँकड़ा है, जो यह निर्धारित करने के लिए उपयोग किया जाता है कि क्या दो समूहों के साधनों के बीच एक महत्वपूर्ण अंतर है, जो कुछ विशेषताओं में संबंधित हो सकता है। टी-टेस्ट, परिकल्पना परीक्षण के उद्देश्य से उपयोग किए जाने वाले कई परीक्षणों में से एक है आंकड़ों में। एक टी-परीक्षण को शामिल करने के लिए तीन प्रमुख डेटा मूल्यों की आवश्यकता होती है। वे प्रत्येक डेटा सेट (माध्य अंतर कहा जाता है), प्रत्येक समूह के मानक विचलन और प्रत्येक समूह के डेटा मूल्यों की संख्या के बीच अंतर मानों को शामिल करते हैं। कई अलग-अलग प्रकार के टी-परीक्षण होते हैं जो निर्भर करता है आवश्यक विश्लेषण के डेटा और प्रकार पर।
अस्पष्ट परीक्षण के परिणाम
विचार करें कि एक दवा निर्माता एक नई आविष्कृत दवा का परीक्षण करना चाहता है। यह रोगियों के एक समूह पर दवा की कोशिश करने और नियंत्रण समूह नामक एक अन्य समूह को प्लेसबो देने की मानक प्रक्रिया का पालन करता है। नियंत्रण समूह को दिया गया प्लेसबो बिना किसी चिकित्सीय मूल्य का एक पदार्थ है और यह मापने के लिए एक बेंचमार्क के रूप में कार्य करता है कि दूसरे समूह को, जिसे वास्तविक दवा दी जाती है, प्रतिक्रिया करता है।
ड्रग ट्रायल के बाद, प्लेसबो-फेड कंट्रोल ग्रुप के सदस्यों ने औसत जीवन प्रत्याशा में तीन साल की वृद्धि दर्ज की, जबकि समूह के सदस्यों को जो नई दवा निर्धारित करते हैं, औसत जीवन प्रत्याशा में चार साल की वृद्धि की रिपोर्ट करते हैं। तत्काल अवलोकन यह संकेत दे सकता है कि दवा वास्तव में काम कर रही है क्योंकि दवा का उपयोग करने वाले समूह के लिए परिणाम बेहतर हैं। हालांकि, यह भी संभव है कि अवलोकन एक मौका घटना के कारण हो सकता है, विशेष रूप से भाग्य का एक आश्चर्यजनक टुकड़ा। यदि परिणाम वास्तव में सही हैं और संपूर्ण जनसंख्या पर लागू होते हैं, तो निष्कर्ष निकालने के लिए एक टी-टेस्ट उपयोगी है।
एक स्कूल में, कक्षा ए में 100 छात्रों ने 3% के मानक विचलन के साथ औसतन 85% स्कोर किया। कक्षा बी से संबंधित अन्य 100 छात्रों ने 4% के मानक विचलन के साथ औसतन 87% स्कोर किया। जबकि कक्षा B का औसत कक्षा A की तुलना में बेहतर है, इस निष्कर्ष पर कूदना सही नहीं हो सकता है कि कक्षा B में छात्रों का समग्र प्रदर्शन कक्षा A के छात्रों की तुलना में बेहतर है क्योंकि यह है, साथ में मतलब, कक्षा B का मानक विचलन भी कक्षा A की तुलना में अधिक है। यह दर्शाता है कि निम्न और उच्च पक्षों पर उनके चरम प्रतिशत, वर्ग A की तुलना में बहुत अधिक फैले हुए थे। A- परीक्षण का निर्धारण करने में मदद कर सकता है। कौन सा वर्ग बेहतर प्रदर्शन करता है
टी-टेस्ट मान्यताओं
- टी-परीक्षणों के संबंध में की गई पहली धारणा माप के पैमाने की चिंता करती है। टी-टेस्ट के लिए धारणा यह है कि एकत्र किए गए डेटा पर लागू माप का पैमाना एक निरंतर या क्रमिक पैमाने का अनुसरण करता है, जैसे कि एक आईक्यू टेस्ट के लिए स्कोर। दूसरी धारणा यह है कि एक सरल यादृच्छिक नमूना है, जो डेटा है कुल आबादी का एक प्रतिनिधि, यादृच्छिक रूप से चयनित भाग से एकत्र किया जाता है। तीसरी धारणा डेटा है, जब प्लॉट किया जाता है, तो एक सामान्य वितरण, घंटी के आकार का वितरण वक्र होता है। चौथी धारणा एक बड़े नमूना आकार का उपयोग किया जाता है। बड़ा नमूना आकार का मतलब है कि परिणामों का वितरण सामान्य घंटी के आकार का वक्र होना चाहिए। अंतिम धारणा विचरण की समरूपता है। समरूप, या समान, विचरण मौजूद है जब नमूनों के मानक विचलन लगभग बराबर हैं।
टी-टेस्ट की गणना
टी-टेस्ट की गणना के लिए तीन प्रमुख डेटा मानों की आवश्यकता होती है। उनमें प्रत्येक डेटा सेट (माध्य अंतर कहा जाता है), प्रत्येक समूह के मानक विचलन और प्रत्येक समूह के डेटा मूल्यों की संख्या के बीच के बीच का अंतर शामिल है।
टी-टेस्ट के परिणाम टी-मूल्य का उत्पादन करते हैं। इसके बाद गणना की गई टी-वैल्यू की तुलना क्रिटिकल वैल्यू टेबल (टी-डिस्ट्रीब्यूशन टेबल) से प्राप्त मूल्य से की जाती है। यह तुलना यह निर्धारित करने में मदद करती है कि संयोग से होने वाले साधनों के बीच का अंतर कितना संभव है या क्या डेटा सेट में वास्तव में आंतरिक अंतर है। टी-टेस्ट सवाल करता है कि क्या समूहों के बीच का अंतर अध्ययन में एक सच्चे अंतर का प्रतिनिधित्व करता है या यदि यह एक व्यर्थ सांख्यिकीय अंतर है।
T- वितरण तालिकाएँ
टी-डिस्ट्रीब्यूशन टेबल वन-टेल और टू-टेल फॉर्मेट में उपलब्ध है। पूर्व का उपयोग उन मामलों का आकलन करने के लिए किया जाता है जिनके पास एक स्पष्ट दिशा (सकारात्मक या नकारात्मक) के साथ एक निश्चित मूल्य या सीमा होती है। उदाहरण के लिए, -3 से नीचे आउटपुट मूल्य की संभावना क्या है, या पासा की एक जोड़ी को रोल करते समय सात से अधिक हो रही है? उत्तरार्द्ध का उपयोग सीमाबद्ध विश्लेषण के लिए किया जाता है, जैसे कि यह पूछना कि क्या निर्देशांक -2 और +2 के बीच आते हैं।
गणना मानक सॉफ़्टवेयर प्रोग्रामों के साथ की जा सकती है जो आवश्यक सांख्यिकीय कार्यों का समर्थन करते हैं, जैसे कि एमएस एक्सेल में पाए जाते हैं।
टी-मूल्यों और स्वतंत्रता की डिग्री
टी-टेस्ट अपने आउटपुट के रूप में दो मूल्यों का उत्पादन करता है: टी-मूल्य और स्वतंत्रता की डिग्री। टी-वैल्यू दो सैंपल सेटों के बीच के अंतर और सैंपल सेट्स के भीतर मौजूद अंतर के बीच का अंतर है। जबकि संख्यात्मक मान (दो नमूना सेटों के बीच का अंतर) गणना करने के लिए सीधा है, भाजक (नमूना सेट के भीतर मौजूद अंतर) थोड़ा जटिल हो सकता है, जिसमें शामिल डेटा मानों के प्रकार पर निर्भर करता है। अनुपात का भाजक फैलाव या परिवर्तनशीलता का माप है। टी-मान के उच्च मूल्य, जिसे टी-स्कोर भी कहा जाता है, यह दर्शाता है कि दो नमूना सेटों के बीच एक बड़ा अंतर मौजूद है। टी-वैल्यू जितना छोटा होगा, दो सैंपल सेट्स के बीच उतनी ही समानता मौजूद होगी।
- एक बड़ा टी-स्कोर इंगित करता है कि समूह अलग-अलग हैं। छोटा टी-स्कोर इंगित करता है कि समूह समान हैं।
स्वतंत्रता की डिग्री एक अध्ययन में मूल्यों को संदर्भित करती है जिसमें अलग-अलग होने की स्वतंत्रता है और महत्व और अशक्त परिकल्पना की वैधता का आकलन करने के लिए आवश्यक है। इन मूल्यों की गणना आमतौर पर नमूना सेट में उपलब्ध डेटा रिकॉर्ड की संख्या पर निर्भर करती है।
सहसंबंधित (या जोड़ीदार) टी-टेस्ट
सहसंबद्ध टी-परीक्षण तब किया जाता है जब नमूने आम तौर पर समान इकाइयों के मिलान जोड़े से मिलकर होते हैं, या जब दोहराया उपायों के मामले होते हैं। उदाहरण के लिए, एक ही रोगियों के बार-बार परीक्षण किए जाने के उदाहरण हो सकते हैं - एक विशेष उपचार प्राप्त करने से पहले और बाद में। ऐसे मामलों में, प्रत्येक रोगी को अपने खिलाफ नियंत्रण नमूने के रूप में इस्तेमाल किया जा रहा है।
यह विधि उन मामलों पर भी लागू होती है जहां नमूने किसी तरह से संबंधित होते हैं या उनमें मिलान की विशेषताएं होती हैं, जैसे बच्चों, माता-पिता या भाई-बहनों से तुलनात्मक विश्लेषण। सहसंबंधित या युग्मित टी-परीक्षण एक आश्रित प्रकार के होते हैं, क्योंकि इनमें ऐसे मामले शामिल होते हैं जहाँ नमूनों के दो सेट संबंधित होते हैं।
युग्मित टी-टेस्ट के लिए टी-मान और स्वतंत्रता की डिग्री के लिए सूत्र है:
- माध्य 1 और माध्य 2 नमूना सेटों में से प्रत्येक के औसत मूल्य हैं, जबकि var1 और var2 नमूना सेटों में से प्रत्येक के विचरण का प्रतिनिधित्व करते हैं।
शेष दो प्रकार स्वतंत्र टी-टेस्ट के हैं। इन प्रकारों के नमूनों को एक-दूसरे से स्वतंत्र चुना जाता है - यानी, दो समूहों में डेटा सेट समान मानों को संदर्भित नहीं करते हैं। इनमें 100 रोगियों के समूह में से 50 रोगियों के दो सेटों में विभाजित होने जैसे मामले शामिल हैं। समूहों में से एक नियंत्रण समूह बन जाता है और उसे एक प्लेसबो दिया जाता है, जबकि दूसरे समूह को निर्धारित उपचार प्राप्त होता है। यह दो स्वतंत्र नमूना समूहों का गठन करता है जो एक दूसरे के साथ अप्रभावित रहते हैं।
समान भिन्न (या पूलित) टी-टेस्ट
समान विचरण t- परीक्षण का उपयोग तब किया जाता है जब प्रत्येक समूह में नमूनों की संख्या समान होती है, या दो डेटा सेटों का विचरण समान होता है। निम्नलिखित सूत्र का उपयोग टी-मान और स्वतंत्रता की डिग्री के बराबर विचरण टी-टेस्ट की गणना के लिए किया जाता है:
T-value = n1 + n2−2 (n1)1) × var12 + (n2−1) × var22 × n11 + n21 mean1 − mean2 जहां: mean1 और mean2 = प्रत्येक का औसत मान नमूना setvar1 और var2 = प्रत्येक नमूना सेट 1 और n2 = प्रत्येक नमूना सेट में रिकॉर्ड की संख्या का भिन्न
तथा, स्वतंत्रता का आधार = n1 + n2 of2where: n1 और n2 = प्रत्येक नमूने सेट में रिकॉर्ड की संख्या
असमान विर्सजन टी-टेस्ट
असमान विचरण टी-टेस्ट का उपयोग तब किया जाता है जब प्रत्येक समूह में नमूनों की संख्या अलग-अलग होती है, और दो डेटा सेटों का विचरण भी अलग-अलग होता है। इस परीक्षण को वेल्च का टी-टेस्ट भी कहा जाता है। निम्नलिखित सूत्र का उपयोग असमान विचरण टी-टेस्ट के लिए टी-मान और स्वतंत्रता की डिग्री की गणना के लिए किया जाता है:
टी-मान = n1var12 + n2var22 माध्य 1 where माध्य 2: माध्य 1 और माध्य 2 = प्रत्येक का औसत मान सेट setvar1 और var2 = नमूना सेटों में से प्रत्येक का भिन्न और n2 = प्रत्येक नमूना सेट में रिकॉर्ड की संख्या n2 =।
तथा, स्वतंत्रता की डिग्री = n1−1 (n1var12) 2 + n2 (1 (n2var22) 2 (n1var12 + n2var22) 2 जहां: var1 और var2 = नमूना सेटों में से प्रत्येक का भिन्न 1 और n2 = संख्या प्रत्येक नमूना सेट में रिकॉर्ड का
उपयोग करने के लिए सही टी-टेस्ट का निर्धारण
निम्नलिखित फ्लोचार्ट का उपयोग यह निर्धारित करने के लिए किया जा सकता है कि नमूना सेटों की विशेषताओं के आधार पर कौन से टी-परीक्षण का उपयोग किया जाना चाहिए। विचार की जाने वाली प्रमुख वस्तुओं में शामिल हैं कि क्या नमूना रिकॉर्ड समान हैं, प्रत्येक नमूना सेट में डेटा रिकॉर्ड की संख्या और प्रत्येक नमूना सेट का विचरण।
जूली बैंग द्वारा इमेज © इन्वेस्टोपेडिया 2019
असमान विविधता टी टेस्ट उदाहरण
मान लें कि हम एक आर्ट गैलरी में प्राप्त चित्रों का विकर्ण माप ले रहे हैं। नमूनों के एक समूह में 10 पेंटिंग शामिल हैं, जबकि दूसरे में 20 पेंटिंग शामिल हैं। संबंधित माध्य और विचरण मानों के साथ डेटा सेट निम्नानुसार हैं:
1 सेट करें | 2 सेट करें | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
मीन | 19.4 | 21.6 |
झगड़ा | 1.4 | 17.1 |
हालांकि सेट 2 का मतलब सेट 1 की तुलना में अधिक है, हम यह निष्कर्ष नहीं निकाल सकते हैं कि सभी चित्रों की औसत लंबाई लगभग 21.6 यूनिट है क्योंकि सेट 2 का विचरण सेट 1 से काफी अधिक है। क्या यह संयोग से होता है, या क्या अंतर वास्तव में मौजूद हैं कला दीर्घा में प्राप्त सभी चित्रों की समग्र जनसंख्या में? हम अशक्त परिकल्पना मानकर समस्या को स्थापित करते हैं कि माध्य दो नमूना सेटों के बीच समान है और यह पुष्टि करने के लिए एक टी-परीक्षण करें कि क्या परिकल्पना सही है।
चूंकि डेटा रिकॉर्ड की संख्या अलग है (n1 = 10 और n2 = 20) और विचरण भी अलग-अलग है, स्वतंत्रता के टी-मूल्य और डिग्री की गणना असमान विरल टी-टेस्ट में वर्णित सूत्र का उपयोग करके उपरोक्त डेटा सेट के लिए की जाती है। अनुभाग।
टी-वैल्यू -2.24787 है। चूंकि दो टी-मानों की तुलना करते समय माइनस साइन को नजरअंदाज किया जा सकता है, परिकलित मूल्य 2.24787 है।
स्वतंत्रता मूल्य की डिग्री 24.38 है और कम से कम संभव पूर्णांक मूल्य के मूल्य के नीचे की आवश्यकता होती है, सूत्र परिभाषा के कारण 24 को कम कर दिया जाता है।
जब भी एक सामान्य वितरण ग्रहण किया जाता है, तो एक स्वीकृति के मानदंड के रूप में संभाव्यता का स्तर (अल्फा स्तर, महत्व का स्तर, पी ) निर्दिष्ट कर सकता है। ज्यादातर मामलों में, 5% मान लिया जा सकता है।
स्वतंत्रता मूल्य की डिग्री को 24 के रूप में और महत्व के 5% के स्तर का उपयोग करते हुए, टी-मूल्य वितरण तालिका पर एक नज़र 2.064 का मान देती है। 2.247 के गणना मूल्य के मुकाबले इस मूल्य की तुलना करना दर्शाता है कि गणना की गई टी-वैल्यू 5% के महत्व के स्तर पर टेबल मूल्य से अधिक है। इसलिए, शून्य परिकल्पना को अस्वीकार करना सुरक्षित है कि साधनों के बीच कोई अंतर नहीं है। आबादी के सेट में आंतरिक अंतर हैं, और वे संयोग से नहीं हैं।
निवेश खातों की तुलना करें × इस तालिका में दिखाई देने वाले प्रस्ताव उन साझेदारियों से हैं जिनसे इन्वेस्टोपेडिया को मुआवजा मिलता है। प्रदाता का नाम विवरणसंबंधित शर्तें
वेरिएंस का विश्लेषण कैसे (ANOVA) वर्क्स एनालिसिस ऑफ वेरिएंस (ANOVA) एक सांख्यिकीय विश्लेषण उपकरण है जो डेटा में पाए गए कुल परिवर्तनशीलता को दो घटकों में विभाजित करता है: यादृच्छिक और व्यवस्थित कारक। अधिक जेड-टेस्ट परिभाषा एक जेड-परीक्षण एक सांख्यिकीय परीक्षण है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो जनसंख्या साधन भिन्न होते हैं, जब संस्करण ज्ञात होते हैं और नमूना आकार बड़ा होता है। फ्रीडम डिफेंड की अधिक डिग्रियां फ्रीडम की डिग्रियों से तात्पर्य है कि डेटा सैंपल में भिन्नता के लिए लॉजिकल रूप से स्वतंत्र मूल्यों की अधिकतम संख्या है। अधिक टी वितरण को समझना एटी डिस्ट्रीब्यूशन एक प्रकार का प्रायिकता फंक्शन है जो कि छोटे सैंपल साइज या अनजान वर्जन के लिए पॉप्युलेशन पैरामीटर के आकलन के लिए उपयुक्त है। अधिक अर्ध-विचलन उपाय अर्ध-विचलन निवेश पर रिटर्न में नीचे-मतलब उतार-चढ़ाव का मूल्यांकन करने की एक विधि है। इसका उपयोग मानक विचलन के विकल्प के रूप में किया जाता है। अधिक बोनफेरोनी टेस्ट एक बोनफेरोनी टेस्ट सांख्यिकीय विश्लेषण में उपयोग किए जाने वाले कई तुलनात्मक परीक्षण का एक प्रकार है। अधिक साथी लिंकसंबंधित आलेख
अर्थशास्त्र
टी-टेस्ट का आयोजन करते समय क्या धारणाएं बनाई जाती हैं?
जोखिम प्रबंधन
भविष्य के जोखिम के लिए ऐतिहासिक अस्थिरता का उपयोग करना
शेयर ट्रेडिंग रणनीति और शिक्षा
स्टॉक की कीमतों का अनुकरण करने के लिए एक्सेल का उपयोग कैसे करें
वित्तीय अनुपात
आप एक्सेल में आईआरआर की गणना कैसे करते हैं?
गणित और सांख्यिकी
एक सापेक्ष मानक त्रुटि क्या है
वित्तीय अनुपात
Excel में शुद्ध वर्तमान मूल्य (NPV) की गणना करने का सूत्र क्या है?
