निर्धारण का गुणांक क्या है?
निर्धारण का गुणांक सांख्यिकीय विश्लेषण में उपयोग किया जाने वाला एक उपाय है जो यह आकलन करता है कि एक मॉडल भविष्य के परिणामों की कितनी अच्छी तरह व्याख्या करता है और भविष्यवाणी करता है। यह डेटा सेट में स्पष्ट रूप से परिवर्तनशीलता के स्तर का संकेत है। दृढ़ संकल्प के गुणांक, जिसे आमतौर पर "आर-स्क्वेर" के रूप में भी जाना जाता है, का उपयोग मॉडल की सटीकता को मापने के लिए एक दिशानिर्देश के रूप में किया जाता है।
इस आंकड़े की व्याख्या करने का एक तरीका यह है कि किसी दिए गए मॉडल में शामिल चरों का अवलोकन भिन्नता का लगभग x% है। इसलिए, यदि आर 2 = 0.50 है, तो लगभग आधे भिन्न रूपांतरों को मॉडल द्वारा समझाया जा सकता है।
R-squared
चाबी छीन लेना
- निर्धारण का गुणांक डेटा के भविष्य के मॉडल के सांख्यिकीय विश्लेषण पर केंद्रित एक जटिल विचार है। दृढ़ संकल्प के गुणांक का उपयोग यह समझाने के लिए किया जाता है कि एक कारक की परिवर्तनशीलता दूसरे कारक के संबंध के कारण कितनी हो सकती है।
निर्धारण के गुणांक को समझना
निर्धारण के गुणांक का उपयोग यह समझाने के लिए किया जाता है कि एक कारक की परिवर्तनशीलता दूसरे कारक के संबंध के कारण कितनी हो सकती है। यह प्रवृत्ति विश्लेषण में काफी हद तक निर्भर है और इसे 0 और 1 के बीच के मूल्य के रूप में दर्शाया गया है।
करीब दो कारकों के बीच मूल्य 1 के करीब है, बेहतर फिट, या संबंध। निर्धारण का गुणांक सहसंबंध गुणांक का वर्ग है, जिसे "आर" के रूप में भी जाना जाता है, जो इसे दो चर के बीच रैखिक सहसंबंध की डिग्री प्रदर्शित करने की अनुमति देता है।
इस सह-संबंध को "फिटनेस की अच्छाई" के रूप में जाना जाता है। 1.0 का मान एक परिपूर्ण फिट को इंगित करता है, और यह इस प्रकार भविष्य के पूर्वानुमान के लिए एक बहुत ही विश्वसनीय मॉडल है, यह दर्शाता है कि मॉडल देखे गए सभी रूपों की व्याख्या करता है। दूसरी ओर, 0 का मान, यह दर्शाता है कि मॉडल डेटा को सही ढंग से मॉडल करने में विफल रहता है। कई चर के साथ एक मॉडल के लिए, जैसे एक एकाधिक प्रतिगमन मॉडल, समायोजित आर 2 दृढ़ संकल्प का एक बेहतर गुणांक है। अर्थशास्त्र में, 0.60 से ऊपर के एक आर 2 मूल्य को सार्थक के रूप में देखा जाता है।
निर्धारण के गुणांक के विश्लेषण के लाभ
निर्धारण का गुणांक, अंकों के वास्तविक सेट बनाम डेटा सेट में अनुमानित अंकों के बीच सहसंबंध का वर्ग है। इसे X और Y स्कोर के बीच संबंध के वर्ग के रूप में भी व्यक्त किया जा सकता है, जिसमें X स्वतंत्र चर है और Y आश्रित चर है।
प्रतिनिधित्व के बावजूद, 0 के बराबर एक आर-वर्ग का मतलब है कि स्वतंत्र चर का उपयोग करके आश्रित चर का अनुमान नहीं लगाया जा सकता है। इसके विपरीत, यदि यह 1 के बराबर है, तो इसका मतलब है कि एक चर के आश्रित को हमेशा स्वतंत्र चर द्वारा भविष्यवाणी की जाती है।
इस सीमा के भीतर होने वाले निर्धारण का गुणांक उस सीमा को मापता है जिस पर निर्भर चर की स्वतंत्र चर द्वारा भविष्यवाणी की जाती है। उदाहरण के लिए, 0.20 के एक आर-वर्ग का अर्थ है कि आश्रित चर का 20% स्वतंत्र चर द्वारा भविष्यवाणी किया जाता है।
फिट की अच्छाई, या रैखिक सहसंबंध की डिग्री, एक ग्राफ पर एक फिट लाइन और सभी डेटा बिंदुओं के बीच की दूरी को मापता है जो ग्राफ के आसपास बिखरे हुए हैं। डेटा के तंग सेट में एक प्रतिगमन रेखा होगी जो बिंदुओं के बहुत करीब है और एक उच्च स्तर फिट है, जिसका अर्थ है कि लाइन और डेटा के बीच की दूरी बहुत छोटी है। एक अच्छे फिट में R-squared है जो 1 के करीब है।
हालाँकि, R- वर्ग यह निर्धारित करने में असमर्थ है कि डेटा बिंदु या पूर्वानुमान पक्षपाती हैं या नहीं। यह विश्लेषक या उपयोगकर्ता को यह भी नहीं बताता है कि निर्धारण मूल्य का गुणांक अच्छा है या नहीं। उदाहरण के लिए, एक कम R- वर्ग खराब नहीं है, और यह R- वर्ग संख्या के आधार पर निर्णय लेने के लिए व्यक्ति पर निर्भर है।
दृढ़ संकल्प के गुणांक की व्याख्या भोलेपन से नहीं की जानी चाहिए। उदाहरण के लिए, यदि किसी मॉडल के R-squared को 75% पर रिपोर्ट किया गया है, तो उसकी त्रुटियों का विचरण निर्भर चर के विचरण से 75% कम है, और इसकी त्रुटियों का मानक विचलन निर्भरता के मानक विचलन से 50% कम है चर। मॉडल की त्रुटियों का मानक विचलन त्रुटियों के मानक विचलन के आकार का लगभग एक तिहाई है जो आपको एक निरंतर-केवल मॉडल के साथ मिलेगा।
अंत में, भले ही एक आर-स्क्वेर मान बड़ा हो, एक मॉडल में व्याख्यात्मक चर का कोई सांख्यिकीय महत्व नहीं हो सकता है, या व्यावहारिक रूप में इन चर का आकार बहुत छोटा हो सकता है।
