वर्गों का योग क्या है?
वर्गों का योग डेटा बिंदुओं के फैलाव को निर्धारित करने के लिए प्रतिगमन विश्लेषण में उपयोग की जाने वाली एक सांख्यिकीय तकनीक है। एक प्रतिगमन विश्लेषण में, लक्ष्य यह निर्धारित करना है कि डेटा श्रृंखला को कितनी अच्छी तरह से एक फ़ंक्शन पर फिट किया जा सकता है जो यह समझाने में मदद कर सकता है कि डेटा श्रृंखला कैसे उत्पन्न हुई थी। वर्गों का योग एक गणितीय तरीके से फ़ंक्शन को खोजने के लिए उपयोग किया जाता है जो डेटा से सबसे अच्छा फिट बैठता है (भिन्न होता है)।
चौकों के योग के लिए सूत्र है
N वस्तुओं के एक सेट X के लिए: वर्गों का योग = i = 0 (n (Xi)X) 2 वे: Xi = सेट में ith आइटम = सेट में सभी वस्तुओं का मतलब (शी −X)) = माध्य से प्रत्येक वस्तु का विचलन
वर्गों के योग को भिन्नता के रूप में भी जाना जाता है।
वर्गों का योग आपको क्या बताता है?
वर्गों का योग माध्य से विचलन का माप है। आंकड़ों में, माध्य संख्याओं के एक सेट का औसत है और केंद्रीय प्रवृत्ति का सबसे अधिक इस्तेमाल किया जाने वाला माप है। अंकगणितीय माध्य की गणना केवल डेटा सेट में मानों की संख्या और मूल्यों की संख्या से विभाजित करके की जाती है।
बता दें कि पिछले पांच दिनों में Microsoft (MSFT) की बंद कीमतें अमेरिकी डॉलर में 74.01, 74.77, 73.94, 73.61 और 73.40 थीं। कुल कीमतों का योग $ 369.73 है और पाठ्यपुस्तक का औसत या औसत मूल्य इस प्रकार $ 369.73 / 5 = $ 73.95 होगा।
लेकिन माप सेट का मतलब जानना हमेशा पर्याप्त नहीं होता है। कभी-कभी, यह जानना उपयोगी होता है कि माप के एक सेट में कितनी भिन्नता है। अलग-अलग मूल्य इस अर्थ से अलग हैं कि अवलोकन या मूल्यों को बनाए गए प्रतिगमन मॉडल के लिए कितना उपयुक्त है, इस बारे में कुछ जानकारी दे सकते हैं।
उदाहरण के लिए, यदि कोई विश्लेषक जानना चाहता था कि क्या MSFT का शेयर मूल्य Apple (AAPL) की कीमत के साथ मिलकर चलता है, तो वह एक निश्चित अवधि के लिए दोनों शेयरों की प्रक्रिया के लिए टिप्पणियों के सेट को सूचीबद्ध कर सकता है, 1, 2, या 10 साल और रिकॉर्ड किए गए प्रत्येक अवलोकन या माप के साथ एक रैखिक मॉडल बनाएं। यदि दोनों चर (यानी, AAPL की कीमत और MSFT की कीमत) के बीच संबंध एक सीधी रेखा नहीं है, तो डेटा सेट में भिन्नताएं हैं जिनकी जांच करने की आवश्यकता है।
आंकड़ों में बोलते हैं, अगर बनाए गए रैखिक मॉडल में रेखा मूल्य के सभी माप से नहीं गुजरती है, तो कुछ परिवर्तनशीलता जो कि शेयर की कीमतों में देखी गई है, अस्पष्टीकृत है। वर्गों के योग का उपयोग यह गणना करने के लिए किया जाता है कि क्या एक रैखिक संबंध दो चर के बीच मौजूद है, और किसी अस्पष्टीकृत परिवर्तनशीलता को वर्गों के अवशिष्ट योग के रूप में संदर्भित किया जाता है।
वर्गों का योग भिन्नता के वर्ग का योग है, जहाँ भिन्नता को प्रत्येक व्यक्ति के मान और माध्य के बीच प्रसार के रूप में परिभाषित किया जाता है। वर्गों के योग का निर्धारण करने के लिए, प्रत्येक डेटा बिंदु और सबसे अच्छी रेखा के बीच की दूरी को चुकता किया जाता है और फिर सारांशित किया जाता है। सर्वोत्तम फिट की रेखा इस मूल्य को कम कर देगी।
वर्गों के योग की गणना कैसे करें
अब आप देख सकते हैं कि माप को वर्ग विचलन का योग क्यों कहा जाता है, या छोटे के लिए वर्गों का योग। ऊपर हमारे MSFT उदाहरण का उपयोग करके, वर्गों की राशि की गणना इस प्रकार की जा सकती है:
- एसएस = (74.01 - 73.95) 2 + (74.77 - 73.95) 2 + (73.94 - 73.95) 2 + (73.61 - 73.95) 2 + (73.40 - 73.95) 2 एसएस = (0.06) 2 + (0.82) 2 + (-) 0.01) 2 + (-0.34) 2 + (-0.55) 2 एसएस = 1.0942
बिना विचलन के अकेले विचलन के योग को जोड़ने के परिणामस्वरूप या शून्य के बराबर संख्या होगी क्योंकि नकारात्मक विचलन लगभग पूरी तरह से सकारात्मक विचलन को ऑफसेट करेंगे। अधिक यथार्थवादी संख्या प्राप्त करने के लिए, विचलन का योग चुकाना होगा। वर्गों का योग हमेशा एक धनात्मक संख्या होगा क्योंकि किसी भी संख्या का वर्ग, चाहे वह धनात्मक या ऋणात्मक हो, सदैव धनात्मक होता है।
चौकों के योग का उपयोग कैसे करें इसका उदाहरण
MSFT गणना के परिणामों के आधार पर, वर्गों का एक उच्च योग इंगित करता है कि अधिकांश मान क्षुद्र से दूर हैं, और इसलिए, डेटा में बड़ी परिवर्तनशीलता है। वर्गों का कम योग टिप्पणियों के सेट में कम परिवर्तनशीलता को संदर्भित करता है।
ऊपर के उदाहरण में, 1.0942 से पता चलता है कि पिछले पांच दिनों में MSFT के शेयर की कीमत में परिवर्तनशीलता बहुत कम है और मूल्य स्थिरता और कम अस्थिरता वाले शेयरों में निवेश करने के इच्छुक निवेशक MSFT का विकल्प चुन सकते हैं।
चाबी छीन लेना
- वर्गों का योग औसत मान से दूर डेटा बिंदुओं के विचलन को मापता है। उच्च राशि-वर्ग परिणाम डेटा सेट के भीतर परिवर्तनशीलता की एक बड़ी डिग्री को इंगित करता है, जबकि एक कम परिणाम इंगित करता है कि डेटा औसत मूल्य से काफी भिन्न होता है। ।
वर्गों के योग का उपयोग करने की सीमाएं
किस शेयर को खरीदने के लिए निवेश का निर्णय लेना यहां सूचीबद्ध लोगों की तुलना में कई अधिक टिप्पणियों की आवश्यकता है। एक विश्लेषक को एक उच्च निश्चितता के साथ यह जानने के लिए डेटा के वर्षों के साथ काम करना पड़ सकता है कि किसी संपत्ति की परिवर्तनशीलता कितनी अधिक या कम है। जैसे-जैसे सेट में अधिक डेटा बिंदु जुड़ते हैं, वर्गों का योग बड़ा होता जाता है क्योंकि मान अधिक फैल जाएंगे।
भिन्नता का सबसे व्यापक रूप से उपयोग किया जाने वाला माप मानक विचलन और विचरण है। हालाँकि, दोनों में से किसी एक मैट्रिक्स की गणना करने के लिए, वर्गों के योग की गणना सबसे पहले की जानी चाहिए। विचरण वर्गों के योग का औसत (यानी, अवलोकनों की संख्या से विभाजित वर्गों का योग) है। मानक विचलन विचरण का वर्गमूल है।
प्रतिगमन विश्लेषण के दो तरीके हैं जो वर्गों के योग का उपयोग करते हैं: रैखिक कम से कम वर्ग विधि और गैर-रैखिक न्यूनतम वर्ग विधि। सबसे कम वर्ग विधि इस तथ्य को संदर्भित करती है कि प्रतिगमन फ़ंक्शन वास्तविक डेटा बिंदुओं से विचरण के वर्गों के योग को कम करता है। इस तरह, एक फ़ंक्शन खींचना संभव है जो सांख्यिकीय रूप से डेटा के लिए सबसे अच्छा फिट प्रदान करता है। ध्यान दें कि एक प्रतिगमन फ़ंक्शन रैखिक (एक सीधी रेखा) या गैर-रैखिक (एक वक्र रेखा) हो सकता है।
