एक्सेल में मल्टीपल रिग्रेशन कैसे करें। एक्सेल में त्वरित रेखीय प्रतिगमन: ट्रेंडलाइन

ऐड-इन का उपयोग करके सांख्यिकीय डेटा प्रोसेसिंग भी की जा सकती है विश्लेषण पैकेज(चित्र 62)।

प्रस्तावित वस्तुओं में से, आइटम का चयन करें " प्रतिगमन” और बाईं माउस बटन से उस पर क्लिक करें। अगला, ठीक क्लिक करें।

चित्र में दिखाई गई खिड़की। 63.

विश्लेषण उपकरण « प्रतिगमन» कम से कम वर्ग विधि का उपयोग करके अवलोकनों के एक सेट के लिए एक ग्राफ को फिट करने के लिए प्रयोग किया जाता है। प्रतिगमन का उपयोग एक या एक से अधिक स्वतंत्र चर के मूल्यों के एकल आश्रित चर पर प्रभाव का विश्लेषण करने के लिए किया जाता है। उदाहरण के लिए, एक एथलीट का एथलेटिक प्रदर्शन उम्र, ऊंचाई और वजन सहित कई कारकों से प्रभावित होता है। एक एथलीट के प्रदर्शन पर इन तीन कारकों में से प्रत्येक के प्रभाव की डिग्री की गणना करना संभव है, और फिर किसी अन्य एथलीट के प्रदर्शन की भविष्यवाणी करने के लिए प्राप्त डेटा का उपयोग करें।

प्रतिगमन उपकरण फ़ंक्शन का उपयोग करता है लाइनस्ट.

REGRESS डायलॉग बॉक्स

लेबल यदि पहली पंक्ति या इनपुट रेंज के पहले कॉलम में शीर्षक हैं तो चेकबॉक्स चुनें। यदि कोई शीर्षलेख नहीं है तो इस चेक बॉक्स को साफ़ करें। इस स्थिति में, आउटपुट टेबल डेटा के लिए उपयुक्त हेडर अपने आप जेनरेट हो जाएंगे।

विश्वसनीयता स्तर आउटपुट योग तालिका में एक अतिरिक्त स्तर शामिल करने के लिए चेक बॉक्स का चयन करें। उपयुक्त फ़ील्ड में, डिफ़ॉल्ट 95% कॉन्फ़िडेंस लेवल के अलावा, कॉन्फिडेंस लेवल दर्ज करें जिसे आप लागू करना चाहते हैं।

स्थिरांक - शून्य प्रतिगमन रेखा को मूल बिंदु से गुजरने के लिए बॉक्स को चेक करें।

आउटपुट रेंज आउटपुट रेंज के ऊपरी बाएँ सेल का संदर्भ दर्ज करें। परिणामों की आउटपुट तालिका के लिए कम से कम सात कॉलम आवंटित करें, जिसमें शामिल होंगे: विचरण के विश्लेषण के परिणाम, गुणांक, Y की गणना की मानक त्रुटि, मानक विचलन, प्रेक्षणों की संख्या, गुणांकों के लिए मानक त्रुटियाँ।

नई वर्कशीट कार्यपुस्तिका में एक नई वर्कशीट खोलने और सेल A1 से शुरू होने वाले विश्लेषण परिणामों को सम्मिलित करने के लिए इस बॉक्स को चेक करें। यदि आवश्यक हो, उपयुक्त रेडियो बटन स्थिति के विपरीत क्षेत्र में नई शीट के लिए एक नाम दर्ज करें।

नई कार्यपुस्तिका एक नई कार्यपुस्तिका बनाने के लिए इस बॉक्स को चेक करें जिसमें परिणाम एक नई शीट में जोड़े जाएंगे।

अवशिष्ट आउटपुट तालिका में अवशिष्टों को शामिल करने के लिए चेक बॉक्स का चयन करें।

मानकीकृत अवशिष्ट आउटपुट तालिका में मानकीकृत अवशिष्टों को शामिल करने के लिए चेक बॉक्स का चयन करें।

अवशिष्ट प्लॉट प्रत्येक स्वतंत्र चर के लिए अवशिष्टों को प्लॉट करने के लिए बॉक्स को चेक करें।

फ़िट प्लॉट प्रेक्षित मानों बनाम प्रेक्षित मानों को प्लॉट करने के लिए चेक बॉक्स का चयन करें।

सामान्य संभावना प्लॉटसामान्य संभावना प्लॉट करने के लिए बॉक्स को चेक करें।

समारोह लाइनस्ट

गणना करने के लिए, उस सेल का चयन करें जिसमें हम औसत मान को कर्सर के साथ प्रदर्शित करना चाहते हैं और कीबोर्ड पर = कुंजी दबाएं। अगला, नाम फ़ील्ड में, वांछित फ़ंक्शन निर्दिष्ट करें, उदाहरण के लिए औसत(चित्र 22)।

समारोह लाइनस्टएक सीधी रेखा की गणना करने के लिए कम से कम वर्ग विधि का उपयोग करके किसी श्रृंखला के आंकड़ों की गणना करता है जो उपलब्ध डेटा का सबसे अच्छा अनुमान लगाता है और फिर एक सरणी देता है जो परिणामी सीधी रेखा का वर्णन करता है। आप फ़ंक्शन को जोड़ भी सकते हैं लाइनस्टअन्य प्रकार के मॉडल की गणना करने के लिए अन्य कार्यों के साथ जो अज्ञात पैरामीटर में रैखिक हैं (जिनके अज्ञात पैरामीटर रैखिक हैं), बहुपद, लॉगरिदमिक, घातीय, और बिजली की श्रृंखला. क्योंकि मानों की एक सरणी वापस आ जाती है, फ़ंक्शन को एक सरणी सूत्र के रूप में निर्दिष्ट किया जाना चाहिए।

सीधी रेखा के लिए समीकरण है:

y=m 1 x 1 +m 2 x 2 +…+b (x मानों की कई श्रेणियों के मामले में),

जहाँ आश्रित मूल्य y स्वतंत्र मान x का एक कार्य है, मान m प्रत्येक स्वतंत्र चर x के संगत गुणांक हैं, और b एक स्थिरांक है। ध्यान दें कि y, x और m सदिश हो सकते हैं। समारोह लाइनस्टएक सरणी देता है (एमएन; एमएन -1; ...; एम 1; बी)। लाइनस्टअतिरिक्त प्रतिगमन आँकड़े भी लौटा सकते हैं।

लाइनस्ट(ज्ञात_y-मान; ज्ञात_x-मान; स्थिरांक; आंकड़े)

ज्ञात_य मान - y मानों का समूह जो पहले से ही संबंध y=mx+b के लिए जाना जाता है।

यदि ज्ञात_वाई की सरणी में एक स्तंभ है, तो ज्ञात_एक्स की सरणी के प्रत्येक स्तंभ को एक अलग चर के रूप में व्याख्या किया जाता है।

यदि ज्ञात_वाई की सरणी में एक पंक्ति है, तो ज्ञात_एक्स की सरणी की प्रत्येक पंक्ति को एक अलग चर के रूप में व्याख्या किया जाता है।

ज्ञात_x मान - x मानों का एक वैकल्पिक सेट जो पहले से ही संबंध y=mx+b के लिए जाना जाता है।

ज्ञात_एक्स सरणी में चर के एक या अधिक सेट हो सकते हैं। यदि केवल एक चर का उपयोग किया जाता है, तो arrays_ogn_y_values ​​​​और ज्ञात_x_values ​​​​किसी भी आकार के हो सकते हैं - जब तक कि उनके पास समान आयाम हों। यदि एक से अधिक चर का उपयोग किया जाता है, तो ज्ञात_वाई एक सदिश होना चाहिए (यानी, एक पंक्ति ऊंची या एक स्तंभ चौड़ा)।

यदि array_ज्ञात_x छोड़ा जाता है, तो इस सरणी (1;2;3;...) को array_ज्ञात_y के समान आकार माना जाता है।

कॉन्स्ट एक बूलियन मान है जो निर्दिष्ट करता है कि स्थिर बी को 0 होना आवश्यक है या नहीं।

यदि तर्क "स्थिरांक" TRUE है या छोड़ा गया है, तो स्थिरांक b का सामान्य रूप से मूल्यांकन किया जाता है।

यदि तर्क "const" FALSE है, तो b का मान 0 माना जाता है और m का मान इस तरह चुना जाता है कि संबंध y=mx संतुष्ट हो जाता है।

सांख्यिकी एक बूलियन मान है जो इंगित करता है कि क्या अतिरिक्त प्रतिगमन आँकड़े लौटाए जाने चाहिए।

यदि आँकड़े सत्य हैं, तो LINEST अतिरिक्त प्रतिगमन आँकड़े लौटाता है। लौटाई गई सरणी इस तरह दिखेगी: (mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid).

यदि आँकड़े FALSE हैं या छोड़े गए हैं, तो LINEST केवल गुणांक m और स्थिरांक b लौटाता है।

अतिरिक्त प्रतिगमन आँकड़े। (तालिका 17)

कीमत विवरण
से1, से2,..., सेन गुणांक m1,m2,...,mn के लिए मानक त्रुटि मान।
सेब मानक मूल्यनिरंतर b के लिए त्रुटियाँ (seb = #N/A यदि 'const' तर्क FALSE है)।
आर 2 निर्धारण गुणांक। y के वास्तविक मानों की तुलना सरल रेखा समीकरण से प्राप्त मानों से की जाती है; तुलना के परिणामों के आधार पर, नियतत्ववाद के गुणांक की गणना की जाती है, 0 से 1 तक सामान्य किया जाता है। यदि यह 1 के बराबर है, तो मॉडल के साथ पूर्ण संबंध है, अर्थात वास्तविक और अनुमानित मूल्यों के बीच कोई अंतर नहीं है वाई का। अन्यथा, यदि नियतत्ववाद का गुणांक 0 है, तो y मानों की भविष्यवाणी करने के लिए प्रतिगमन समीकरण का उपयोग करने का कोई मतलब नहीं है। प्राप्त करने के लिए अतिरिक्त जानकारी R2 की गणना करने के तरीकों के लिए, इस खंड के अंत में "टिप्पणी" देखें।
सेय वाई अनुमान के लिए मानक त्रुटि।
एफ एफ-सांख्यिकीय या एफ-अवलोकन मूल्य। F आँकड़ा का उपयोग यह निर्धारित करने के लिए किया जाता है कि आश्रित और स्वतंत्र चर के बीच एक मनाया गया संबंध यादृच्छिक है या नहीं।
df स्वतंत्रता की कोटियां। एक सांख्यिकीय तालिका में एफ-महत्वपूर्ण मूल्यों को खोजने के लिए स्वतंत्रता की डिग्री उपयोगी होती है। मॉडल के विश्वास स्तर का निर्धारण करने के लिए, आपको LINEST द्वारा लौटाए गए F-सांख्यिकी के साथ तालिका में मूल्यों की तुलना करनी चाहिए। डीएफ की गणना के बारे में अधिक जानकारी के लिए इस खंड के अंत में "टिप्पणी" देखें। उदाहरण 4 नीचे F और df के उपयोग को दर्शाता है।
ssreg वर्गों का प्रतिगमन योग।
sresid वर्गों का अवशिष्ट योग। ssreg और ssresid की गणना के बारे में अधिक जानकारी के लिए, इस खंड के अंत में "टिप्पणी" देखें।

नीचे दिया गया आंकड़ा उस क्रम को दिखाता है जिसमें अतिरिक्त प्रतिगमन आंकड़े लौटाए जाते हैं (चित्र 64)।

टिप्पणियाँ:

किसी भी सीधी रेखा को उसके ढलान और y-अक्ष के साथ प्रतिच्छेदन द्वारा वर्णित किया जा सकता है:

ढलान (एम): एक रेखा के ढलान को निर्धारित करने के लिए, जिसे आम तौर पर एम द्वारा दर्शाया जाता है, आपको लाइन पर दो बिंदु लेने की आवश्यकता होती है (x 1, y 1) और (x 2, y 2); ढलान (y 2 -y 1) / (x 2 -x 1) के बराबर होगा।

Y-चौराहा (b): एक रेखा का y-चौराहा, जिसे आमतौर पर b द्वारा दर्शाया जाता है, उस बिंदु के लिए y मान होता है जहाँ रेखा y-अक्ष को काटती है।

सरल रेखा समीकरण का रूप y=mx+b है। यदि m और b के मान ज्ञात हों, तो रेखा के किसी भी बिंदु की गणना समीकरण में y या x के मानों को प्रतिस्थापित करके की जा सकती है। आप TREND फ़ंक्शन का भी उपयोग कर सकते हैं।

यदि केवल एक स्वतंत्र चर x है, तो आप निम्न सूत्रों का उपयोग करके सीधे ढलान और y-अवरोधन प्राप्त कर सकते हैं:

ढलान: INDEX(LINEST(ज्ञात_वर्ष, ज्ञात_x), 1)

Y-अवरोधन: INDEX(LINEST(ज्ञात_वर्ष, ज्ञात_x), 2)

LINEST फ़ंक्शन द्वारा परिकलित सीधी रेखा का उपयोग करके सन्निकटन की सटीकता डेटा स्कैटर की डिग्री पर निर्भर करती है। डेटा एक सीधी रेखा के जितना करीब होता है, LINEST द्वारा उपयोग किया जाने वाला मॉडल उतना ही सटीक होता है। LINEST फ़ंक्शन डेटा के लिए सर्वोत्तम फ़िट का निर्धारण करने के लिए कम से कम वर्ग विधि का उपयोग करता है। जब केवल एक स्वतंत्र चर x, m और b की गणना निम्न सूत्रों का उपयोग करके की जाती है:

जहाँ x और y नमूने के साधन हैं, उदाहरण के लिए x = AVERAGE(ज्ञात_x's) और y = AVERAGE(ज्ञात_y's)।

LINEST और LGRFPRIBL फ़िट फ़ंक्शन एक सीधे या घातीय वक्र की गणना कर सकते हैं जो डेटा के लिए सबसे उपयुक्त है। हालांकि, वे इस सवाल का जवाब नहीं देते हैं कि समस्या को हल करने के लिए दोनों में से कौन सा परिणाम अधिक उपयुक्त है। आप किसी सीधी रेखा के लिए TREND(ज्ञात_y-मान; ज्ञात_x-मान) फ़ंक्शन या एक्सपोनेंशियल कर्व के लिए GROWTH(ज्ञात_y-मान; ज्ञात_x-मान) फ़ंक्शन की गणना भी कर सकते हैं। ये फ़ंक्शन, यदि new_x_values ​​​​तर्क से छोड़े गए हैं, तो एक सीधी रेखा या वक्र के अनुसार वास्तविक x मानों के लिए परिकलित y मानों की एक सरणी लौटाते हैं। फिर आप परिकलित मानों की वास्तविक मानों से तुलना कर सकते हैं। आप दृश्य तुलना के लिए चार्ट भी बना सकते हैं।

प्रतिगमन विश्लेषण करके, Microsoft Excelप्रत्येक बिंदु के लिए अनुमानित y मान और वास्तविक y मान के बीच के अंतर का वर्ग परिकलित करता है। इन वर्गों के अंतरों के योग को वर्गों का अवशिष्ट योग (ssresid) कहा जाता है। Microsoft Excel फिर वर्गों के कुल योग (sstotal) की गणना करता है। यदि const = TRUE या यदि यह तर्क निर्दिष्ट नहीं है, तो वर्गों का कुल योग वास्तविक y मानों और औसत y मानों के वर्ग अंतरों के योग के बराबर होगा। यदि const = FALSE है, तो वर्गों का योग वास्तविक y मानों के वर्गों के योग के बराबर होगा (भागफल y से माध्य y को घटाए बिना)। उसके बाद, वर्गों के प्रतिगमन योग की गणना निम्नानुसार की जा सकती है: ssreg = sstotal - ssresid। वर्गों का अवशिष्ट योग जितना छोटा होगा, अधिक मूल्यनियतत्ववाद r2 का गुणांक, जो दर्शाता है कि उपयोग करके प्राप्त समीकरण कितना अच्छा है प्रतिगमन विश्लेषण, चरों के बीच संबंधों की व्याख्या करता है। गुणांक r2 ssreg/sstotal के बराबर है।

कुछ मामलों में, एक या अधिक एक्स कॉलम (यह मानते हुए कि वाई और एक्स मान कॉलम में हैं) के पास अन्य एक्स कॉलम में अतिरिक्त भविष्य कहनेवाला मूल्य नहीं है। दूसरे शब्दों में, एक या अधिक एक्स कॉलम हटाने से वाई मान हो सकते हैं समान सूक्ष्मता से गणना की जाती है। इस मामले में, निरर्थक एक्स कॉलम को प्रतिगमन मॉडल से बाहर रखा जाएगा। इस घटना को "समरेखता" कहा जाता है क्योंकि एक्स के अनावश्यक स्तंभों को कई गैर-निरर्थक स्तंभों के योग के रूप में दर्शाया जा सकता है। LINEST संपार्श्विकता के लिए जाँच करता है और प्रतिगमन मॉडल से किसी भी अनावश्यक X स्तंभ को निकालता है यदि यह कोई पाता है। हटाए गए X कॉलम को 0 के गुणक और 0 के se के मान द्वारा LINEST आउटपुट में पहचाना जा सकता है। अनावश्यक के रूप में एक या एक से अधिक कॉलम को हटाने से df का मान बदल जाता है क्योंकि यह भविष्यवाणी के उद्देश्यों के लिए वास्तव में उपयोग किए जाने वाले X कॉलम की संख्या पर निर्भर करता है। डीएफ की गणना के बारे में अधिक जानकारी के लिए नीचे उदाहरण 4 देखें। जब डीएफ अनावश्यक स्तंभों को हटाने के कारण बदलता है, तो से और एफ के मान भी बदलते हैं। अक्सर संपार्श्विकता का उपयोग करने की अनुशंसा नहीं की जाती है। हालाँकि, इसका उपयोग तब किया जाना चाहिए जब कुछ X कॉलम में एक संकेतक के रूप में 0 या 1 होता है जो इंगित करता है कि प्रयोग का विषय एक अलग समूह में है या नहीं। यदि const = TRUE या यदि यह तर्क निर्दिष्ट नहीं है, तो LINEST प्रतिच्छेदन बिंदु का अनुकरण करने के लिए एक अतिरिक्त X स्तंभ सम्मिलित करता है। यदि पुरुषों के लिए 1 और महिलाओं के लिए 0 के साथ एक कॉलम है, और महिलाओं के लिए 1 और पुरुषों के लिए 0 के साथ एक कॉलम है, तो अंतिम कॉलम हटा दिया जाता है क्योंकि इसके मान से प्राप्त किया जा सकता है "पुरुष संकेतक" कॉलम।

उन मामलों के लिए डीएफ की गणना जहां कॉललाइनरिटी के कारण मॉडल से एक्स कॉलम नहीं हटाए जाते हैं: यदि के ज्ञात_एक्स कॉलम हैं और कॉन्स्ट = ट्रू या निर्दिष्ट नहीं है, तो डीएफ = एन - के - 1. यदि कॉन्स्ट = गलत है, फिर डीएफ = एन-के। दोनों ही मामलों में, संपार्श्विकता के कारण X स्तंभों को हटाने से df का मान 1 से बढ़ जाता है।

सूत्र जो सरणी लौटाते हैं उन्हें सरणी सूत्रों के रूप में दर्ज किया जाना चाहिए।

एक ज्ञात_x_मान तर्क के रूप में स्थिरांक की एक सरणी दर्ज करते समय, उदाहरण के लिए, एक ही पंक्ति पर मानों को अलग करने के लिए अर्धविराम का उपयोग करें, और अलग-अलग पंक्तियों के लिए एक बृहदान्त्र। नियंत्रण कक्ष में "भाषा और मानक" विंडो में सेटिंग्स के आधार पर विभाजक वर्ण भिन्न हो सकते हैं।

ध्यान दें कि प्रतिगमन समीकरण द्वारा अनुमानित y मान सही नहीं हो सकते हैं यदि वे समीकरण को परिभाषित करने के लिए उपयोग किए गए y मानों की सीमा से बाहर हैं।

फ़ंक्शन में उपयोग किया जाने वाला मुख्य एल्गोरिदम लाइनस्ट, कार्यों के मुख्य एल्गोरिदम से अलग है इच्छाऔर रेखा खंड. एल्गोरिदम के बीच अंतर अनिश्चित और समरेख डेटा के लिए अलग-अलग परिणाम दे सकता है। उदाहरण के लिए, यदि ज्ञात_वाई के तर्क के डेटा बिंदु 0 हैं और ज्ञात_एक्स के तर्क के डेटा बिंदु 1 हैं, तो:

समारोह लाइनस्ट 0. फ़ंक्शन एल्गोरिथम के बराबर मान लौटाता है लाइनस्टसमरेख डेटा के लिए उपयुक्त मान वापस करने के लिए उपयोग किया जाता है, जिस स्थिति में कम से कम एक उत्तर मिल सकता है।

SLOPE और INTERCEPT फ़ंक्शन #DIV/0! त्रुटि लौटाते हैं। SLOPE और INTERCEPT फ़ंक्शंस के एल्गोरिथ्म का उपयोग केवल एक उत्तर खोजने के लिए किया जाता है, और इस मामले में कई हो सकते हैं।

अन्य प्रकार के प्रतिगमन के लिए आँकड़ों की गणना करने के अलावा, LINEST का उपयोग LINEST के लिए x और y चरों की श्रृंखला के रूप में x और y चरों के कार्यों को दर्ज करके अन्य प्रकार के प्रतिगमन के लिए श्रेणियों की गणना करने के लिए किया जा सकता है। उदाहरण के लिए, निम्न सूत्र:

LINEST(y-मान, x-मान^COLUMN($A:$C))

Y मानों के एक स्तंभ और X मानों के एक स्तंभ के साथ निम्न रूप के घन सन्निकटन (तीसरी डिग्री बहुपद) की गणना करने के लिए काम करता है:

y=m 1 x+m 2 x 2 +m 3 x 3 +b

सूत्र को अन्य प्रकार के प्रतिगमन की गणना के लिए संशोधित किया जा सकता है, लेकिन कुछ मामलों में, आउटपुट मानों और अन्य आँकड़ों में समायोजन की आवश्यकता होती है।

यह गतिविधि के विभिन्न क्षेत्रों में उपयोगी होने के लिए जाना जाता है, जिसमें अर्थमिति जैसे अनुशासन शामिल हैं, जहां इस सॉफ़्टवेयर उपयोगिता का उपयोग कार्य में किया जाता है। मूल रूप से, व्यावहारिक और प्रयोगशाला अभ्यासों की सभी क्रियाएं एक्सेल में की जाती हैं, जो कुछ क्रियाओं की विस्तृत व्याख्या करते हुए कार्य को बहुत सुविधाजनक बनाती हैं। इसलिए, विश्लेषण उपकरणों में से एक "प्रतिगमन" का उपयोग कम से कम वर्ग विधि का उपयोग करके टिप्पणियों के एक सेट के लिए एक ग्राफ का चयन करने के लिए किया जाता है। आइए विचार करें कि कार्यक्रम का यह उपकरण क्या है और उपयोगकर्ताओं के लिए इसका क्या लाभ है। नीचे भी एक संक्षिप्त लेकिन है स्पष्ट निर्देशएक प्रतिगमन मॉडल का निर्माण।

मुख्य कार्य और प्रतिगमन के प्रकार

प्रतिगमन दिए गए चरों के बीच एक संबंध है, जिसके कारण इन चरों के भविष्य के व्यवहार का पूर्वानुमान निर्धारित करना संभव है। चर मानव व्यवहार सहित विभिन्न आवधिक घटनाएं हैं। इस एक्सेल विश्लेषण का उपयोग एक या अधिक चर के मूल्यों के विशिष्ट आश्रित चर पर प्रभाव का विश्लेषण करने के लिए किया जाता है। उदाहरण के लिए, किसी स्टोर में बिक्री कई कारकों से प्रभावित होती है, जिसमें वर्गीकरण, मूल्य और स्टोर का स्थान शामिल है। एक्सेल में प्रतिगमन का उपयोग करके, आप मौजूदा बिक्री के परिणामों के आधार पर इनमें से प्रत्येक कारक के प्रभाव की डिग्री निर्धारित कर सकते हैं, और फिर प्राप्त डेटा को एक और महीने के लिए या पास में स्थित किसी अन्य स्टोर के लिए बिक्री का अनुमान लगाने के लिए लागू कर सकते हैं।

प्रतिगमन आमतौर पर रूप में प्रस्तुत किया जाता है सरल समीकरण, चर के दो समूहों के बीच संबंध की निर्भरता और ताकत को प्रकट करना, जहां एक समूह निर्भर या अंतर्जात है, और दूसरा स्वतंत्र या बहिर्जात है। यदि परस्पर संबंधित संकेतकों का एक समूह है, तो आश्रित चर Y तर्क के तर्क के आधार पर निर्धारित किया जाता है, और बाकी स्वतंत्र एक्स-चर के रूप में कार्य करते हैं।

प्रतिगमन मॉडल बनाने के मुख्य कार्य इस प्रकार हैं:

  1. महत्वपूर्ण स्वतंत्र चर का चयन (Х1, Х2, …, Xk)।
  2. समारोह के प्रकार का चयन।
  3. गुणांकों के लिए अनुमानों का निर्माण।
  4. इमारत विश्वास अंतरालऔर प्रतिगमन कार्य।
  5. गणना किए गए अनुमानों और निर्मित प्रतिगमन समीकरण के महत्व की जाँच करना।

प्रतिगमन विश्लेषण के कई प्रकार हैं:

  • युग्मित (1 आश्रित और 1 स्वतंत्र चर);
  • एकाधिक (कई स्वतंत्र चर)।

प्रतिगमन समीकरण दो प्रकार के होते हैं:

  1. रेखीय, चरों के बीच एक सख्त रेखीय संबंध को दर्शाता हुआ।
  2. अरैखिक—ऐसे समीकरण जिनमें घात, भिन्न और त्रिकोणमितीय फलन शामिल हो सकते हैं।

मॉडल निर्माण निर्देश

एक्सेल में दिए गए निर्माण को करने के लिए, आपको निर्देशों का पालन करना होगा:


आगे की गणना के लिए, "रैखिक ()" फ़ंक्शन का उपयोग किया जाना चाहिए, वाई मान, एक्स मान, कॉन्स्ट और आंकड़े निर्दिष्ट करना। उसके बाद, "ट्रेंड" फ़ंक्शन - वाई-वैल्यू, एक्स-वैल्यू, न्यू वैल्यू, कॉन्स्ट का उपयोग करके रिग्रेशन लाइन पर बिंदुओं का सेट निर्धारित करें। दिए गए मापदंडों का उपयोग करके गणना करें अज्ञात मूल्यसमस्या की दी गई शर्तों के आधार पर गुणांक।

में एक्सेलएक रेखीय प्रतिगमन (और यहां तक ​​​​कि मुख्य प्रकार के गैर-रैखिक प्रतिगमन, नीचे देखें) को प्लॉट करने का एक और भी तेज़ और अधिक सुविधाजनक तरीका है। इसे इस प्रकार किया जा सकता है:

1) डेटा वाले कॉलम चुनें एक्सऔर वाई(वे उसी क्रम में होने चाहिए!);

2) कॉल करें चार्ट विज़ार्डऔर एक समूह में चयन करें प्रकारछितराया हुआऔर तुरंत दबा दें तैयार;

3) आरेख को अचयनित किए बिना, दिखाई देने वाले मुख्य मेनू आइटम का चयन करें आरेखजिसमें आपको आइटम का चयन करना चाहिए ट्रेंड लाइन जोड़ें;

4) दिखाई देने वाले डायलॉग में प्रवृत्ति रेखाटैब प्रकारचुनना रेखीय;

5) टैब विकल्पस्विच को सक्रिय किया जा सकता है चार्ट पर समीकरण दिखाएं, जो आपको रैखिक प्रतिगमन समीकरण (4.4) देखने की अनुमति देगा, जिसमें गुणांक (4.5) की गणना की जाएगी।

6) एक ही टैब में, आप स्विच को सक्रिय कर सकते हैं आरेख पर सन्निकटन विश्वास का मान रखें (R^2). यह मान सहसंबंध गुणांक (4.3) का वर्ग है और यह दर्शाता है कि परिकलित समीकरण प्रायोगिक निर्भरता का कितनी अच्छी तरह वर्णन करता है। अगर आर 2 एकता के करीब है, तो सैद्धांतिक प्रतिगमन समीकरण प्रयोगात्मक निर्भरता का अच्छी तरह से वर्णन करता है (सिद्धांत प्रयोग से अच्छी तरह सहमत है), और यदि आर 2 शून्य के करीब है, तो यह समीकरण प्रायोगिक निर्भरता (सिद्धांत प्रयोग से सहमत नहीं है) का वर्णन करने के लिए उपयुक्त नहीं है।

वर्णित क्रियाओं को करने के परिणामस्वरूप, आपको एक प्रतिगमन ग्राफ और उसके समीकरण के साथ एक आरेख मिलेगा।

§4.3। मुख्य प्रकार के गैर-रैखिक प्रतिगमन

परवलयिक और बहुपद प्रतिगमन।

अणुवृत्त आकार कामूल्य की निर्भरता वाईमूल्य से एक्सअवलंबन कहा जाता है द्विघात फंक्शन(द्वितीय क्रम पैराबोला):

यह समीकरण कहा जाता है परवलयिक प्रतिगमन वाईपर एक्स. विकल्प , बी, साथबुलाया परवलयिक प्रतिगमन गुणांक. परवलयिक प्रतिगमन गुणांक की गणना हमेशा बोझिल होती है, इसलिए गणना के लिए कंप्यूटर का उपयोग करने की सिफारिश की जाती है।

परवलयिक प्रतिगमन का समीकरण (4.8) एक अधिक सामान्य प्रतिगमन का एक विशेष मामला है जिसे बहुपद कहा जाता है। बहुपदमूल्य की निर्भरता वाईमूल्य से एक्सबहुपद द्वारा व्यक्त की गई निर्भरता कहलाती है एन-वाँ आदेश:

नंबर कहां हैं एक मैं (मैं=0,1,…, एन) कहा जाता है बहुपद प्रतिगमन गुणांक.

शक्ति प्रतिगमन।

शक्तिमूल्य की निर्भरता वाईमूल्य से एक्सप्रपत्र की निर्भरता कहा जाता है:

यह समीकरण कहा जाता है पावर रिग्रेशन समीकरण वाईपर एक्स. विकल्प और बीबुलाया शक्ति प्रतिगमन गुणांक.

एलएन = एलएन +बीएलएन एक्स. (4.11)

यह समीकरण लॉगरिदमिक समन्वय अक्ष एलएन के साथ विमान में एक सीधी रेखा का वर्णन करता है एक्सऔर एल.एन. इसलिए, शक्ति प्रतिगमन की प्रयोज्यता के लिए मानदंड आवश्यकता है कि अनुभवजन्य डेटा के लघुगणक के बिंदु ln एक्स मैंऔर एल.एन मैंसीधी रेखा (4.11) के सबसे करीब थे।

घातीय प्रतिगमन।

उदाहरणात्मक(या घातीय) मात्रा की निर्भरता वाईमूल्य से एक्सप्रपत्र की निर्भरता कहा जाता है:

(या )। (4.12)

यह समीकरण कहा जाता है घातीय समीकरण(या घातीय) प्रतिगमन वाईपर एक्स. विकल्प (या ) और बीबुलाया घातीय(या घातीय) प्रतिगमन.

यदि हम शक्ति प्रतिगमन समीकरण के दोनों पक्षों का लघुगणक लेते हैं, तो हमें समीकरण मिलता है

एलएन = एक्सएलएन + एलएन बी(या एलएन = के एक्स+ एलएन बी). (4.13)

यह समीकरण बताता है रैखिक निर्भरताएक मान ln का दूसरे मान से लघुगणक एक्स. इसलिए, शक्ति प्रतिगमन की प्रयोज्यता के लिए मानदंड आवश्यकता है कि समान परिमाण के अनुभवजन्य डेटा बिंदु एक्स मैंऔर अन्य मान ln के लघुगणक मैंसीधी रेखा (4.13) के सबसे करीब थे।

लघुगणकीय प्रतिगमन।

लघुगणकमूल्य की निर्भरता वाईमूल्य से एक्सप्रपत्र की निर्भरता कहा जाता है:

=+बीएलएन एक्स. (4.14)

यह समीकरण कहा जाता है लॉगरिदमिक रिग्रेशन वाईपर एक्स. विकल्प और बीबुलाया लघुगणक प्रतिगमन गुणांक.

अतिशयोक्तिपूर्ण प्रतिगमन।

अतिपरवलिकमूल्य की निर्भरता वाईमूल्य से एक्सप्रपत्र की निर्भरता कहा जाता है:

यह समीकरण कहा जाता है अतिशयोक्तिपूर्ण प्रतिगमन समीकरण वाईपर एक्स. विकल्प और बीबुलाया अतिशयोक्तिपूर्ण प्रतिगमन गुणांकऔर कम से कम वर्ग विधि द्वारा निर्धारित किया जाता है। इस विधि को लागू करने से सूत्र बनते हैं:

सूत्रों (4.16-4.17) में, सूचकांक पर योग किया जाता है मैंएक से प्रेक्षणों की संख्या तक एन.

दुर्भाग्य से, में एक्सेलऐसा कोई फ़ंक्शन नहीं है जो अतिशयोक्तिपूर्ण प्रतिगमन के गुणांकों की गणना करता हो। ऐसे मामलों में जहां यह निश्चित रूप से ज्ञात नहीं है कि मापा मान व्युत्क्रमानुपाती से संबंधित हैं, हाइपरबोलिक रिग्रेशन समीकरण के बजाय पावर रिग्रेशन समीकरण देखने की सिफारिश की जाती है, इसलिए एक्सेलइसे खोजने की एक प्रक्रिया है। यदि मापा मूल्यों के बीच एक अतिशयोक्तिपूर्ण निर्भरता मान ली जाती है, तो इसके प्रतिगमन गुणांक की गणना सहायक गणना तालिकाओं और सूत्र (4.16-4.17) का उपयोग करके योग संचालन के लिए की जाएगी।

एमएस एक्सेल पैकेज आपको एक रेखीय प्रतिगमन समीकरण का निर्माण करते समय अधिकांश कार्य बहुत तेज़ी से करने की अनुमति देता है। यह समझना महत्वपूर्ण है कि परिणामों की व्याख्या कैसे की जाए।

काम करने के लिए ऐड-ऑन की आवश्यकता है विश्लेषण पैकेज, जो मेनू आइटम में सक्षम होना चाहिए सेवा \ ऐड-ऑन

Excel 2007 में, विश्लेषण पैक को सक्षम करने के लिए, ब्लॉक पर जाएँ पर क्लिक करें एक्सेल विकल्प, ऊपरी बाएँ कोने में बटन क्लिक करके, और फिर " एक्सेल विकल्प»खिड़की के नीचे:



प्रतिगमन मॉडल बनाने के लिए, आइटम का चयन करें सेवा \ डेटा विश्लेषण \ प्रतिगमन. (एक्सेल 2007 में, यह मोड में है डेटा/डेटा विश्लेषण/प्रतिगमन). एक डायलॉग बॉक्स दिखाई देगा जिसे भरने की आवश्यकता है:

1) इनपुट अंतराल वाई¾ में उन कोशिकाओं का लिंक होता है जिनमें परिणामी विशेषता के मान होते हैं वाई. मान एक कॉलम में होने चाहिए;

2) इनपुट अंतराल एक्स¾ में उन कोशिकाओं का लिंक होता है जिनमें कारकों के मान होते हैं। मान स्तंभों में होने चाहिए;

3) साइन टैगसेट करें कि क्या पहली कोशिकाओं में व्याख्यात्मक पाठ (डेटा लेबल) हैं;

4) विश्वसनीयता स्तर¾ आत्मविश्वास का स्तर है, जिसे डिफ़ॉल्ट रूप से 95% माना जाता है। यदि यह मान आपको सूट नहीं करता है, तो आपको इस सुविधा को सक्षम करने और आवश्यक मान दर्ज करने की आवश्यकता है;

5) साइन शून्य स्थिरांकशामिल है यदि एक समीकरण का निर्माण करना आवश्यक है जिसमें मुक्त चर ;

6) आउटपुट विकल्पनिर्धारित करें कि परिणाम कहाँ रखा जाना चाहिए। डिफ़ॉल्ट बिल्ड मोड नई वर्कशीट;

7) ब्लॉक करें खंडहरआपको अवशिष्टों के आउटपुट और उनके रेखांकन के निर्माण को शामिल करने की अनुमति देता है।

नतीजतन, जानकारी प्रदर्शित होती है जिसमें सभी आवश्यक जानकारी होती है और इसे तीन ब्लॉकों में बांटा जाता है: प्रतिगमन आँकड़े, भिन्नता का विश्लेषण, शेष निकासी. आइए उन पर अधिक विस्तार से विचार करें।

1. प्रतिगमन आँकड़े:

एकाधिक आरसूत्र द्वारा परिभाषित किया गया है ( पियर्सन सहसंबंध गुणांक);

आर (निर्धारण का गुणांक);

सामान्यीकृत आर-स्क्वायर की गणना सूत्र द्वारा की जाती है (कई प्रतिगमन के लिए प्रयुक्त);

मानक त्रुटि एससूत्र द्वारा गणना ;

अवलोकन ¾ डेटा की मात्रा है एन.

2. भिन्नता का विश्लेषण, पंक्ति वापसी:

पैरामीटर dfके बराबर होती है एम(कारकों के सेट की संख्या एक्स);

पैरामीटर एसएससूत्र द्वारा निर्धारित किया जाता है;

पैरामीटर एमएससूत्र द्वारा निर्धारित किया जाता है;

आंकड़े एफसूत्र द्वारा निर्धारित किया जाता है;

महत्व एफ. यदि परिणामी संख्या से अधिक है, तो परिकल्पना को स्वीकार किया जाता है (कोई रैखिक संबंध नहीं), अन्यथा परिकल्पना को स्वीकार किया जाता है (एक रैखिक संबंध होता है)।


3. भिन्नता का विश्लेषण, पंक्ति शेष:

पैरामीटर dfबराबर;

पैरामीटर एसएससूत्र द्वारा निर्धारित किया जाता है ;

पैरामीटर एमएससूत्र द्वारा निर्धारित किया जाता है।

4. भिन्नता का विश्लेषण, पंक्ति कुलपहले दो स्तंभों का योग शामिल है।

5. भिन्नता का विश्लेषण, पंक्ति वाई-चौराहागुणांक, मानक त्रुटि और का मान शामिल है टी-सांख्यिकी।

पी-मान ¾ परिकलित के संगत सार्थकता स्तरों का मान है टी- सांख्यिकीविद। अध्ययनकर्ता द्वारा निर्धारित ( टी-सांख्यिकी; ). अगर पी-मूल्य से अधिक है, तो संबंधित चर सांख्यिकीय रूप से महत्वहीन है और इसे मॉडल से बाहर रखा जा सकता है।

नीचे 95%और शीर्ष 95%¾ सैद्धांतिक रेखीय प्रतिगमन समीकरण के गुणांकों के लिए 95 प्रतिशत विश्वास अंतराल की निचली और ऊपरी सीमाएँ हैं। यदि डेटा एंट्री ब्लॉक में कॉन्फिडेंस प्रायिकता का मान डिफ़ॉल्ट रूप से छोड़ दिया गया था, तो अंतिम दो कॉलम पिछले वाले को डुप्लिकेट करेंगे। यदि उपयोगकर्ता ने एक कस्टम विश्वास मान दर्ज किया है, तो अंतिम दो स्तंभों में निर्दिष्ट विश्वास स्तर के लिए निम्न और ऊपरी बाध्य मान होते हैं।

6. भिन्नता का विश्लेषणलाइनों में गुणांक, मानक त्रुटियां, टी-सांख्यिकीविद, पीसंबंधित के लिए -मान और विश्वास अंतराल।

7. ब्लॉक करें शेष निकासीभविष्यवाणी के मान शामिल हैं वाई(हमारे अंकन में यह है) और अवशेष।

 

अगर यह मददगार था तो कृपया इस लेख को सोशल मीडिया पर साझा करें!