भिन्नता के सापेक्ष संकेतक। भिन्नता संकेतकों की गणना

उतार-चढ़ाव- यह अपने स्वयं के विकास की ख़ासियत के साथ-साथ उन स्थितियों में अंतर के कारण विभिन्न वस्तुओं के लिए समान सांख्यिकीय मूल्य के मूल्यों के बीच एक विसंगति है जिसमें वे स्थित हैं। विविधता का एक उद्देश्य चरित्र होता है और अध्ययन के तहत घटना के सार को समझने में मदद करता है। यदि औसत मूल्य व्यक्तिगत अंतरों को सुचारू करता है, तो इसके विपरीत, भिन्नता उन पर जोर देती है, एक विशेष सांख्यिकीय आबादी के लिए औसत औसत मूल्य की विशिष्टता या गैर-विशिष्टता स्थापित करती है। इस प्रकार, चयनित सांख्यिकीय डेटा की गुणवत्ता के बारे में निष्कर्ष निकालना संभव है।

भिन्नता को आपेक्षिक मात्राओं का उपयोग करके मापा जाता है जिसे कहा जाता है भिन्नता के गुणांकऔर औसत विचलन के औसत मूल्य के अनुपात के रूप में परिभाषित किया गया है। चूंकि माध्य विचलन रैखिक और द्विघात तरीकों से निर्धारित किया जा सकता है, भिन्नता के गुणांक भी उपयुक्त हो सकते हैं। इसलिए, भिन्नता के गुणांकों को सूत्रों द्वारा निर्धारित किया जाना चाहिए

रैखिक; (1.28)

द्विघात (1.29) भिन्नता के गुणांक के मान 0 से 1 तक भिन्न होते हैं, और यह शून्य के जितना करीब होता है, अध्ययन के तहत सांख्यिकीय आबादी के लिए पाया गया औसत मूल्य उतना ही अधिक होता है, और इसलिए सांख्यिकीय डेटा का चयन बेहतर होता है। इस मामले में, भिन्नता के गुणांक का मानदंड मान 1/3 है।

यही है, इस आबादी के लिए औसत मूल्य को विशिष्ट माना जाता है λ 0.333 या at ν 0.333. अन्यथा, औसत मूल्य विशिष्ट नहीं है और अधिक वस्तुनिष्ठ सांख्यिकीय मूल्यों को शामिल करने के लिए सांख्यिकीय जनसंख्या को संशोधित करना आवश्यक है।

आमतौर पर, भिन्नता का द्विघात गुणांक समान डेटा से गणना किए गए रैखिक गुणांक से कुछ हद तक (लगभग 25%) बड़ा होता है। इसका मतलब है कि यह संभव है कि λ 0.333 और ν 0.333, फिर इन गुणांकों का औसत लेना आवश्यक है और इसके मूल्य के आधार पर, पाया गया औसत मूल्य की गैर-विशिष्टता के बारे में अंतिम निष्कर्ष निकालना है।

भिन्नता के रैखिक गुणांक की सहायता से, औसत मूल्य की विशिष्टता या गैर-विशिष्टता के बारे में मौलिक निष्कर्ष द्विघात एक का उपयोग करने से आसान और तेज़ प्राप्त किया जा सकता है। हालाँकि, द्विघात कारक का अधिक सामान्यतः उपयोग किया जाता है क्योंकि विचरण की गणना करने के कई तरीके हैं।

भिन्नता का अनुमान लगाने की इस पद्धति में एक महत्वपूर्ण खामी भी है। दरअसल, उदाहरण के लिए, मानक विचलन के साथ, 15 साल की औसत सेवा अवधि वाले श्रमिकों की प्रारंभिक आबादी σ = 10 वर्ष, "वृद्ध" एक और 15 वर्ष। अब = 30 वर्ष, और मानक विचलनअभी भी 10 के बराबर है। जनसंख्या, जो पहले विषम थी (10/15 * 100 = 66.7%), अंततः पूरी तरह से सजातीय हो जाती है (10/30 * 100 = 33.3%)।

इसलिए, सांख्यिकीय जनसंख्या का अतिरिक्त विश्लेषण संभव है दोलन गुणांक, सूत्र द्वारा निर्धारित

कहाँ पे आर- सांख्यिकीय मूल्यों के योग में सबसे बड़े और सबसे छोटे मूल्यों के बीच अंतर के रूप में भिन्नता की सीमा। वह है

आर \u003d एक्समैक्स -एक्समिन,(1.31)

जहां एक्समैक्स और एक्समिन कुल मिलाकर अधिकतम और न्यूनतम मान हैं।

सांख्यिकीय मूल्यों को समुच्चय में क्रमित करते समय, समूह अंतराल बनते हैं। फिर पदनाम के तहत एक्सअंतराल की सीमा समझी जाती है, और औसत अंतराल मान निरूपित किया जाता है ची. केवल भिन्नता के द्विघात गुणांक पर ध्यान केंद्रित करने के मामले में, विचरण को निर्धारित करने के लिए विभिन्न विधियों का उपयोग किया जा सकता है।

फ़ीचर भिन्नताविभिन्न कारकों द्वारा निर्धारित, इनमें से कुछ कारकों की पहचान की जा सकती है यदि सांख्यिकीय जनसंख्या को एक निश्चित विशेषता के अनुसार समूहों में विभाजित किया जाता है। फिर, समग्र रूप से जनसंख्या में विशेषता की भिन्नता के अध्ययन के साथ, इसके प्रत्येक घटक समूहों और इन समूहों के बीच भिन्नता का अध्ययन करना संभव है। एक साधारण मामले में, जब जनसंख्या को एक कारक के अनुसार समूहों में विभाजित किया जाता है, तो भिन्नता का अध्ययन तीन प्रकार के प्रसरणों की गणना और विश्लेषण करके प्राप्त किया जाता है: सामान्य, इंटरग्रुप और इंट्राग्रुप।

निर्धारण का अनुभवजन्य गुणांक

निर्धारण का अनुभवजन्य गुणांकसांख्यिकीय विश्लेषण में व्यापक रूप से उपयोग किया जाता है और एक संकेतक है जो परिणामी विशेषता में अंतरसमूह फैलाव के हिस्से का प्रतिनिधित्व करता है और एक सामान्य भिन्नता के गठन पर समूहीकरण विशेषता के प्रभाव की ताकत को दर्शाता है। इसकी गणना सूत्र का उपयोग करके की जा सकती है:

कारक सुविधा x के प्रभाव में परिणामी विशेषता y की भिन्नता का हिस्सा दिखाता है, यह द्विघात निर्भरता द्वारा सहसंबंध गुणांक से जुड़ा होता है। एक कनेक्शन की अनुपस्थिति में, निर्धारण का अनुभवजन्य गुणांक शून्य है, और एक कार्यात्मक कनेक्शन के मामले में, यह एक है।

उदाहरण के लिए, जब श्रमिकों की श्रम उत्पादकता की उनकी योग्यता पर निर्भरता का अध्ययन किया जाता है, तो निर्धारण का गुणांक 0.7 है, तो श्रमिकों की श्रम उत्पादकता में 70% भिन्नता उनकी योग्यता में अंतर के कारण होती है और 30% प्रभाव के कारण होती है। अन्य कारकों की।

अनुभवजन्य सहसंबंध है वर्गमूलनिर्धारण के गुणांक से। अनुपात समूहीकरण और प्रभावी सुविधाओं के बीच संबंध की जकड़न को दर्शाता है। अनुभवजन्य सहसंबंध अनुपात -1 से 1 तक मान लेता है। यदि कोई संबंध नहीं है, तो सहसंबंध अनुपात शून्य है, अर्थात। सभी समूह साधन समान हैं और कोई अंतरसमूह भिन्नता नहीं है। इसका मतलब यह है कि समूहीकरण विशेषता सामान्य भिन्नता के गठन को प्रभावित नहीं करती है।

यदि कनेक्शन कार्यात्मक है, तो सहसंबंध अनुपात एक के बराबर है। इस स्थिति में, समूह माध्य का प्रसरण कुल प्रसरण के बराबर होता है, अर्थात। कोई इंट्राग्रुप भिन्नता नहीं। इसका मतलब यह है कि समूहीकरण विशेषता परिणामी विशेषता की भिन्नता को पूरी तरह से निर्धारित करती है।

सहसंबंध अनुपात का मान एक के जितना करीब होता है, सुविधाओं के बीच संबंध उतना ही मजबूत और कार्यात्मक निर्भरता के करीब होता है। अनुभवजन्य सहसंबंध गुणांक के संकेतक के आधार पर रिश्ते की ताकत के गुणात्मक मूल्यांकन के लिए, आप चाडॉक अनुपात का उपयोग कर सकते हैं।

चाडॉक अनुपात

  • कनेक्शन बहुत करीब है - सहसंबंध गुणांक 0.9 - 0.99 . की सीमा में है
  • निकट संबंध - आरएक्सवाई = 0.7 - 0.9
  • कनेक्शन ध्यान देने योग्य है - आरएक्सवाई \u003d 0.5 - 0.7
  • संचार मध्यम है - Rxy = 0.3 - 0.5
  • कनेक्शन कमजोर है - Rxy = 0.1 - 0.3

परिचय

व्यावहारिक और के कार्यान्वयन के लिए दिशानिर्देश प्रयोगशाला कार्यआंकड़ों पर उनके कार्यान्वयन के लिए आवश्यकताएं, मैन्युअल रूप से गणना करने की प्रक्रिया और एमएस एक्सेल, स्टेटिस्टिका पीपीपी का उपयोग करना शामिल है।

दिशानिर्देशों का भाग II भिन्नता के संकेतकों की गणना की विशेषता है: भिन्नता की सीमा, चतुर्थक और चतुर्थक विचलन, औसत रैखिक विचलन, विचरण और माध्य मानक विचलन, दोलन, भिन्नता, विषमता, कुर्टोसिस और अन्य के गुणांक।

वितरण श्रृंखला के विश्लेषण के लिए दिशा-निर्देशों के भाग I में प्रस्तुत अंतराल और असतत भिन्नता श्रृंखला के निर्माण और औसत मूल्यों की गणना के साथ भिन्नता सूचकांकों की गणना का बहुत महत्व है।

विविधता के संकेतकों की गणना

कार्य का उद्देश्य: गणना में व्यावहारिक कौशल प्राप्त करना विभिन्न संकेतक(उपाय) अध्ययन द्वारा निर्धारित कार्यों के आधार पर भिन्नता।

कार्य आदेश:

भिन्नता संकेतकों के प्रकार और रूप (सरल या भारित) का निर्धारण करें।

निष्कर्ष तैयार करें।

भिन्नता के संकेतकों की गणना का एक उदाहरण

विविधता संकेतकों के प्रकार और रूप का निर्धारण।

विविधता संकेतक दो समूहों में विभाजित हैं: निरपेक्ष और सापेक्ष। निरपेक्ष में शामिल हैं: भिन्नता की सीमा, चतुर्थक विचलन, माध्य रैखिक विचलन, विचरण और मानक विचलन। सापेक्ष संकेतक दोलन गुणांक, विविधताएं, सापेक्ष रैखिक विचलन आदि हैं।

भिन्नता की सीमा (R) एक विशेषता की भिन्नता का सबसे सरल माप है और इसे निम्न सूत्र द्वारा निर्धारित किया जाता है:

परिवर्तनीय विशेषता का सबसे बड़ा मूल्य कहां है;

चर विशेषता का सबसे छोटा मान।

चतुर्थक विचलन (Q) - का उपयोग समुच्चय में किसी विशेषता की भिन्नता को दर्शाने के लिए किया जाता है। चरम सीमाओं का उपयोग करने के नुकसान से बचने के लिए भिन्नता की सीमा के बजाय उपयोग किया जा सकता है।

चतुर्थक श्रेणीबद्ध वितरण श्रृंखला में एक विशेषता के मान हैं, जिन्हें इस प्रकार चुना जाता है कि जनसंख्या इकाइयों का 25% आकार में छोटा होगा; 25% इकाइयों को और के बीच संलग्न किया जाएगा; 25% इकाइयाँ बीच में संलग्न होंगी और शेष 25% श्रेष्ठ हैं।

अंतराल की निचली सीमा कहाँ है जिसमें प्रथम चतुर्थक स्थित है;

उस अंतराल से पहले के अंतरालों की संचित आवृत्तियों का योग जिसमें प्रथम चतुर्थक स्थित है;

अंतराल की आवृत्ति जिसमें प्रथम चतुर्थक होता है।

जहां Me श्रंखला की माध्यिका है;

कन्वेंशन मात्रा के लिए समान हैं।

सममित या मध्यम विषम Q2/3 वितरण में। चूंकि चतुर्थक विचलन विशेषता के सभी मूल्यों के विचलन से प्रभावित नहीं होता है, इसलिए इसका उपयोग उन मामलों तक सीमित होना चाहिए जहां मानक विचलन का निर्धारण मुश्किल या असंभव है।

औसत रैखिक विचलन () उनके औसत से विशेषता विकल्पों के पूर्ण विचलन का औसत है। वितरण श्रृंखला में आवृत्तियों की अनुपस्थिति या उपस्थिति के आधार पर, भारित और भारित दोनों, अंकगणितीय माध्य सूत्र का उपयोग करके इसकी गणना की जा सकती है।

(6) - भारित औसत रैखिक विचलन,

(7) - भारित औसत रैखिक विचलन।

फैलाव () - विशेषता के व्यक्तिगत मूल्यों के विचलन का औसत वर्ग उनके औसत मूल्य से। विचरण की गणना सरल भारित और भारित सूत्रों का उपयोग करके की जाती है।

(8) - भारहीन,

(9) - भारित।

मानक विचलन () - भिन्नता का सबसे सामान्य संकेतक, विचरण मान का वर्गमूल है।

भिन्नता की सीमा, चतुर्थक विचलन, माध्य रैखिक और द्विघात विचलन को मात्राएँ कहा जाता है, उनके पास एक औसत विशेषता का आयाम होता है।

एक ही जनसंख्या में विभिन्न लक्षणों के उतार-चढ़ाव की तुलना करने के लिए, या कई आबादी में एक ही विशेषता के उतार-चढ़ाव की तुलना करते समय, भिन्नता के सापेक्ष संकेतकों की गणना की जाती है। तुलना का आधार अंकगणित माध्य है। सबसे अधिक बार, सापेक्ष संकेतक प्रतिशत के रूप में व्यक्त किए जाते हैं और न केवल भिन्नता के तुलनात्मक मूल्यांकन की विशेषता रखते हैं, बल्कि जनसंख्या की एकरूपता की भी विशेषता रखते हैं।

दोलन गुणांक की गणना सूत्र द्वारा की जाती है:

सापेक्ष रैखिक विचलन (भिन्नता का रैखिक गुणांक):

(13) या (14)

भिन्नता का गुणांक:

आँकड़ों में सापेक्ष अस्थिरता का सबसे अधिक इस्तेमाल किया जाने वाला संकेतक भिन्नता का गुणांक है। इसका उपयोग न केवल भिन्नता के तुलनात्मक मूल्यांकन के लिए किया जाता है, बल्कि जनसंख्या की एकरूपता की विशेषता के रूप में भी किया जाता है। सेट को सजातीय माना जाता है यदि भिन्नता का गुणांक 33% से अधिक न हो (एफिमोवा एम.आर., रयात्सेव वी.एम. सांख्यिकी का सामान्य सिद्धांत: पाठ्यपुस्तक एम।: वित्त और सांख्यिकी, 1991, पृष्ठ 105)।

वितरण के आकार का एक अनुमानित विचार प्राप्त करने के लिए, वितरण ग्राफ़ (बहुभुज और एक हिस्टोग्राम) बनाए जाते हैं।

सांख्यिकीय अनुसंधान के अभ्यास में व्यक्ति को विभिन्न वितरणों का सामना करना पड़ता है। सजातीय आबादी का अध्ययन करते समय, हम एक नियम के रूप में, असमान वितरण के साथ व्यवहार करते हैं। मल्टी-वर्टेक्स अध्ययन के तहत आबादी की विविधता को इंगित करता है, दो या दो से अधिक शिखरों की उपस्थिति अधिक सजातीय समूहों की पहचान करने के लिए डेटा को फिर से समूहित करने की आवश्यकता को इंगित करती है। वितरण की सामान्य प्रकृति का पता लगाने में इसकी समरूपता की डिग्री का आकलन करने के साथ-साथ विषमता और कुर्टोसिस के संकेतकों की गणना करना शामिल है। सममितएक वितरण है जिसमें वितरण केंद्र के दोनों किनारों पर समान रूप से दूरी वाले किन्हीं दो प्रकारों की आवृत्तियाँ समान होती हैं। सममित बंटन के लिए, समांतर माध्य, बहुलक और माध्यिका बराबर होती है। इस कारण से, सबसे सरल उपाय विषमताओंवितरण केंद्र के संकेतकों के अनुपात पर आधारित है: साधनों के बीच का अंतर जितना अधिक होगा, श्रृंखला की विषमता उतनी ही अधिक होगी।

के लिये तुलनात्मक विश्लेषणकई वितरणों की विषमता की डिग्री सापेक्ष संकेतक की गणना इस प्रकार करती है:

As मान धनात्मक या ऋणात्मक हो सकता है। संकेतक का एक सकारात्मक मूल्य दाएं तरफा विषमता की उपस्थिति को इंगित करता है (दायां शाखा बाएं की तुलना में अधिकतम कोटि के सापेक्ष अधिक विस्तारित है)। दाएं तरफा विषमता के साथ, वितरण केंद्र के संकेतकों के बीच एक संबंध है:। विषमता सूचकांक का ऋणात्मक चिन्ह बाईं ओर की विषमता की उपस्थिति को इंगित करता है (चित्र 1)। इस मामले में, वितरण केंद्र के संकेतकों के बीच निम्नलिखित संबंध हैं:

चित्रा 1. वितरण: 1 - दाएं तरफा विषमता के साथ; 2 - बाएं तरफा विषमता के साथ।

स्वीडिश गणितज्ञ लिंडबर्ग द्वारा प्रस्तावित एक अन्य संकेतक की गणना सूत्र द्वारा की जाती है:

जहाँ P उन विशेषता मानों का प्रतिशत है जो मान में अंकगणितीय माध्य से अधिक हैं।

तीसरे क्रम के केंद्रीय क्षण के निर्धारण के आधार पर सबसे सटीक और सामान्य संकेतक है (एक सममित वितरण में, इसका मान शून्य है):

तीसरे क्रम का केंद्रीय क्षण कहाँ है:

(19) - अवर्गीकृत डेटा के लिए;

(20) - समूहीकृत डेटा के लिए।

y मानक विचलन है।

इस सूचक का उपयोग न केवल विषमता की मात्रा निर्धारित करना संभव बनाता है, बल्कि सामान्य आबादी में एक विशेषता के वितरण में विषमता की उपस्थिति या अनुपस्थिति के प्रश्न का उत्तर देना भी संभव बनाता है। इस सूचक के महत्व की डिग्री का आकलन माध्य वर्ग त्रुटि का उपयोग करके दिया जाता है, जो टिप्पणियों की मात्रा पर निर्भर करता है n और सूत्र द्वारा गणना की जाती है:

यदि अनुपात महत्वपूर्ण है, तो विषमता महत्वपूर्ण है, और जनसंख्या में विशेषता का वितरण सममित नहीं है। यदि संबंध, विषमता नगण्य है, तो इसकी उपस्थिति को विभिन्न यादृच्छिक परिस्थितियों के प्रभाव से समझाया जा सकता है।

सममित वितरण के लिए, संकेतक की गणना की जाती है कुकुदता(नुकीला)। लिंडबर्ग ने कर्टोसिस के आकलन के लिए निम्नलिखित संकेतक का प्रस्ताव रखा:

जहाँ P, विकल्पों की संख्या का अनुपात (%) है जो अंकगणित माध्य से एक दिशा या किसी अन्य में मानक विचलन के आधे के बराबर है।

सबसे सटीक वह संकेतक है जो चौथे क्रम के केंद्रीय क्षण का उपयोग करता है:

चौथे क्षण का केंद्रीय क्षण कहाँ है;

(24) - अवर्गीकृत डेटा के लिए;

(25) - समूहीकृत डेटा के लिए।

चित्रा 2 दो वितरण दिखाता है: एक चोटी पर है (कुर्टोसिस मान सकारात्मक है), दूसरा फ्लैट-टॉप है (कुर्टोसिस मान नकारात्मक है)। कर्टोसिस सामान्य वितरण वक्र के शीर्ष से ऊपर या नीचे अनुभवजन्य वितरण के शीर्ष की एक बूंद है। एक सामान्य वितरण में, अनुपात

चित्रा 2. वितरण: 1.4 - सामान्य; 2 - इशारा किया; 3 - फ्लैट टॉप

कुर्टोसिस की मूल माध्य वर्ग त्रुटि की गणना सूत्र द्वारा की जाती है:

जहाँ n प्रेक्षणों की संख्या है।

यदि, तो कर्टोसिस महत्वपूर्ण है; यदि, तो यह महत्वहीन है।

विषमता और कुर्टोसिस के संकेतकों के महत्व का आकलन हमें यह निष्कर्ष निकालने की अनुमति देता है कि क्या इस अनुभवजन्य अध्ययन को सामान्य वितरण घटता के प्रकार के लिए जिम्मेदार ठहराया जा सकता है।

भिन्नता के संकेतकों की गणना करने की विधि पर विचार करें।

तालिका 1. सेंट्रल बैंक की कई शाखाओं द्वारा विदेशी मुद्रा की बिक्री की मात्रा पर डेटा।

शाखाओं की समग्रता के लिए मुद्रा बिक्री की औसत मात्रा निर्धारित करें, भिन्नता के निरपेक्ष और सापेक्ष संकेतकों की गणना करें।

आइए भिन्नता की सीमा की गणना करें:

आर = = 24.3 - 10.2 = 14.1 मिलियन रूबल

भिन्नता विचरण दोलन भिन्नता तिरछापन कुर्टोसिस

माध्य और उनके वर्गों से विशेषता मानों के विचलन को निर्धारित करने के लिए, हम एक सहायक तालिका बनाते हैं:

तालिका 2. गणना तालिका

हम साधारण अंकगणितीय माध्य सूत्र का उपयोग करके औसत मान ज्ञात करते हैं:

औसत रैखिक विचलन:

फैलाव:

दोलन कारक:

भिन्नता का गुणांक:

वितरण प्रपत्र के संकेतकों की गणना करने के लिए, हम एक सहायक तालिका बनाते हैं:

तालिका 3. गणना तालिका


तालिका 4. किसी एक उद्योग में उद्यमों के कारोबार पर डेटा।

व्यापार की औसत मात्रा, संरचनात्मक औसत, भिन्नता के पूर्ण और सापेक्ष संकेतक, और वास्तविक वितरण सामान्य के साथ कैसे संगत है (वितरण के रूप के संकेतकों के अनुसार) निर्धारित करें।

संकेतकों की गणना करने के लिए, हम एक सहायक तालिका का निर्माण करेंगे।

तालिका 5. गणना तालिका

विविधता रेंज:

औसत मान अंकगणितीय भारित औसत के सूत्र द्वारा ज्ञात किया जाता है:

अंतराल वितरण श्रृंखला में, बहुलक सूत्र द्वारा निर्धारित किया जाता है:

हमारे मामले में, मोड इसके बराबर होगा:

अंतराल भिन्नता श्रृंखला में, माध्यिका सूत्र द्वारा निर्धारित की जाती है:

हमारे मामले में, माध्यिका होगी:

चतुर्थक विचलन:

जहाँ और क्रमशः वितरण के प्रथम और तृतीय चतुर्थक हैं।

चतुर्थक सूत्रों द्वारा निर्धारित किए जाते हैं:

औसत रैखिक विचलन:

फैलाव:

मानक विचलन:

आइए भिन्नता के सापेक्ष संकेतकों की गणना करें।

दोलन कारक:

सापेक्ष रैखिक विचलन:

चतुर्थक भिन्नता का सापेक्ष संकेतक:

भिन्नता का गुणांक:

आइए वितरण प्रपत्र के संकेतकों को परिभाषित करें:

निष्कर्ष तैयार करना।

आइए हम उदाहरण 2 की भिन्नता के परिकलित संकेतकों पर निष्कर्ष तैयार करें, जो प्रस्तुत करता है अंतराल श्रृंखलाकारोबार के संदर्भ में उद्यमों का वितरण, मिलियन रूबल

भिन्नता की सीमा इंगित करती है कि अधिकतम और न्यूनतम मूल्यों के बीच का अंतर 40 मिलियन रूबल है। व्यापार की औसत मात्रा 30 मिलियन रूबल है। उद्यमों के विचार समूह में व्यापार की मात्रा का सबसे आम मूल्य 31.4 मिलियन रूबल है, और 50% (40 उद्यमों) में व्यापार की मात्रा 30.5 मिलियन रूबल से कम है, और 50% अधिक है।

5 का चतुर्थक विचलन एक मध्यम वितरण विषमता को इंगित करता है, जैसा कि सममित या मध्यम रूप से तिरछा वितरण (इस उदाहरण में) में होता है।

माध्य रैखिक और माध्य वर्ग विचलन दर्शाता है कि अध्ययन के तहत जनसंख्या की इकाइयों में विशेषता के मूल्य में औसतन कितना उतार-चढ़ाव होता है। इस प्रकार, उद्योगों में उद्यमों के व्यापार कारोबार की मात्रा में उतार-चढ़ाव का औसत मूल्य है: औसत रैखिक विचलन के अनुसार - 6.5 मिलियन रूबल। (पूर्ण विचलन); मानक विचलन के अनुसार - 8.1 मिलियन रूबल। किसी विशेषता के व्यक्तिगत मूल्यों के विचलन का वर्ग उनके औसत मूल्य से 65 है।

विशेषता के चरम मूल्यों के बीच का अंतर औसत मूल्य (= 133.3%) से 33.3% अधिक है।

सापेक्ष रैखिक विचलन (= 21.7%) और चतुर्थक भिन्नता का सापेक्ष संकेतक (= 16.4%) अध्ययन आबादी की एकरूपता की विशेषता है, जो 27% के बराबर भिन्नता के परिकलित गुणांक की पुष्टि करता है (वी = 27% 33% से कम) .

तिरछापन और कर्टोसिस के परिकलित संकेतकों के आधार पर, हम यह निष्कर्ष निकाल सकते हैं कि वितरण फ्लैट-टॉप है (उदा< 0) и наблюдается левосторонняя асимметрия (As < 0). Асимметрия и эксцесс являются несущественными.

विविधता संकेतक।आबादी की इकाइयों में एक चर विशेषता का अध्ययन करते समय, कोई व्यक्ति केवल व्यक्तिगत विकल्पों से औसत मूल्य की गणना करने के लिए खुद को सीमित नहीं कर सकता है, क्योंकि समान औसत उन आबादी पर लागू नहीं हो सकता है जो संरचना में समान हैं।

एक विशेषता की भिन्नता अध्ययन की गई आबादी के भीतर एक विशेषता के व्यक्तिगत मूल्यों के बीच का अंतर है।

शब्द "भिन्नता" लैटिन भिन्नता से आया है - परिवर्तन, उतार-चढ़ाव, अंतर। हालांकि, सभी अंतरों को आमतौर पर भिन्नता के रूप में संदर्भित नहीं किया जाता है।

आँकड़ों में भिन्नता को एक सजातीय आबादी के भीतर अध्ययन के तहत विशेषता के मूल्य में ऐसे मात्रात्मक परिवर्तन के रूप में समझा जाता है, जो विभिन्न कारकों की कार्रवाई के प्रतिच्छेदन प्रभाव के कारण होते हैं। व्यक्तिगत मूल्यों के उतार-चढ़ाव को भिन्नता संकेतकों की विशेषता है। भिन्नता जितनी अधिक होगी, उतनी ही अलग, औसतन, व्यक्तिगत मूल्य एक-दूसरे से अलग होते हैं।

निरपेक्ष और सापेक्ष मूल्यों में एक विशेषता की भिन्नता होती है।

निरपेक्ष संकेतकों में शामिल हैं: भिन्नता की सीमा, माध्य रैखिक विचलन, माध्य वर्ग विचलन, विचरण। सभी निरपेक्ष संकेतकअध्ययन के तहत मात्राओं के समान आयाम हैं।

सापेक्ष संकेतकों में दोलन, रैखिक विचलन और भिन्नता के गुणांक शामिल हैं।

आंकड़े निरपेक्ष हैं।आइए हम विशेषता की भिन्नता को दर्शाने वाले निरपेक्ष संकेतकों की गणना करें।

भिन्नता की सीमा एक विशेषता के अधिकतम और न्यूनतम मूल्यों के बीच का अंतर है।

आर = एक्समैक्स - एक्समिन।

विविधता संकेतक की सीमा हमेशा लागू नहीं होती है, क्योंकि यह केवल विशेषता के चरम मूल्यों को ध्यान में रखता है, जो अन्य सभी इकाइयों से बहुत अलग हो सकता है।

अधिक सटीक रूप से, आप उन संकेतकों का उपयोग करके एक श्रृंखला में भिन्नता निर्धारित कर सकते हैं जो अंकगणितीय माध्य से सभी विकल्पों के विचलन को ध्यान में रखते हैं।

आँकड़ों में ऐसे दो संकेतक हैं: माध्य रैखिक और माध्य वर्ग विचलन।

औसत रैखिक विचलन (एल) माध्य से अलग-अलग विकल्पों के विचलन के निरपेक्ष मूल्यों के अंकगणितीय माध्य का प्रतिनिधित्व करता है।

औसत रैखिक विचलन का व्यावहारिक उपयोग इस प्रकार है, इस सूचक की सहायता से, श्रमिकों की संरचना, उत्पादन की लय और सामग्री की आपूर्ति की एकरूपता का विश्लेषण किया जाता है।

इस सूचक का नुकसान यह है कि यह संभावित प्रकार की गणना को जटिल बनाता है और गणितीय आंकड़ों के तरीकों को लागू करना मुश्किल बनाता है।

मानक विचलन () भिन्नता का सबसे सामान्य और स्वीकृत माप है। यह औसत रैखिक विचलन से कुछ बड़ा है। मध्यम असममित वितरण के लिए, उनके बीच निम्नलिखित संबंध स्थापित होता है

इसकी गणना करने के लिए, औसत से प्रत्येक विचलन को चुकता किया जाता है, सभी वर्गों को जोड़ दिया जाता है (वजन को ध्यान में रखते हुए), जिसके बाद वर्गों के योग को श्रृंखला के सदस्यों की संख्या से विभाजित किया जाता है और वर्गमूल से निकाला जाता है लब्धि।

इन सभी क्रियाओं को निम्न सूत्र द्वारा व्यक्त किया जाता है:

वे। मानक विचलन माध्य का वर्गमूल है अंकगणित वर्गऔसत से विचलन।

मानक विचलन माध्य की विश्वसनीयता का माप है। जितना छोटा , उतना ही बेहतर अंकगणितीय माध्य संपूर्ण प्रतिनिधित्व वाली जनसंख्या को दर्शाता है।

औसत मूल्य से विशेषता के मूल्यों के लिए विकल्पों के वर्ग विचलन के अंकगणितीय माध्य को विचरण () कहा जाता है, जिसकी गणना सूत्रों द्वारा की जाती है

इस सूचक की एक विशिष्ट विशेषता यह है कि जब वर्ग () विशिष्ट गुरुत्वछोटे विचलन घटते हैं, और विचलन की कुल मात्रा में बड़ी वृद्धि होती है।

विचरण में कई गुण होते हैं, जिनमें से कुछ की गणना करना आसान हो जाता है:

1. एक स्थिर मान का परिक्षेपण 0 है।

अगर , तो और .

फिर .

2. यदि फीचर वैल्यू (x) के सभी वेरिएंट्स को एक ही नंबर से कम कर दिया जाए, तो वेरिएंस कम नहीं होगा।

चलो, लेकिन फिर अंकगणितीय माध्य और के गुणों के अनुसार।

नई श्रृंखला में विचरण बराबर होगा

वे। श्रृंखला में विचरण मूल श्रृंखला के प्रसरण के बराबर है।

3. यदि विशेषता मानों के सभी प्रकारों को समान संख्या (k बार) से कम किया जाता है, तो विचरण k2 के कारक से कम हो जाएगा।

चलो, फिर और।

नई श्रृंखला का प्रसरण बराबर होगा

4. अंकगणित माध्य के संबंध में परिकलित फैलाव न्यूनतम है। विचलन का माध्य वर्ग, एक मनमाना संख्या के संबंध में परिकलित, अंकगणित माध्य और संख्या के बीच अंतर के वर्ग द्वारा, अंकगणित माध्य के संबंध में परिकलित फैलाव से अधिक है, अर्थात। . माध्य से फैलाव में न्यूनता का गुण होता है, अर्थात। यह हमेशा किसी भी अन्य मात्रा से गणना की गई भिन्नताओं से कम होता है। इस मामले में, जब हम 0 के बराबर होते हैं और इसलिए विचलन की गणना नहीं करते हैं, तो सूत्र बन जाता है:

ऊपर, मात्रात्मक लक्षणों के लिए भिन्नता संकेतकों की गणना पर विचार किया गया था, लेकिन आर्थिक गणना में, गुणात्मक लक्षणों की भिन्नता का आकलन करने का कार्य निर्धारित किया जा सकता है। . उदाहरण के लिए, निर्मित उत्पादों की गुणवत्ता का अध्ययन करते समय, उत्पादों को उच्च-गुणवत्ता और दोषपूर्ण में विभाजित किया जा सकता है।

इस मामले में, हम वैकल्पिक संकेतों के बारे में बात कर रहे हैं।

वैकल्पिक विशेषताएं वे हैं जो जनसंख्या की कुछ इकाइयों के पास होती हैं, जबकि अन्य में नहीं होती हैं। उदाहरण के लिए, आवेदकों के लिए कार्य अनुभव की उपलब्धता, विश्वविद्यालय के शिक्षकों के लिए शैक्षणिक डिग्री आदि। जनसंख्या इकाइयों में एक विशेषता की उपस्थिति को पारंपरिक रूप से 1 से निरूपित किया जाता है, और अनुपस्थिति 0 होती है। फिर, यदि एक विशेषता वाली इकाइयों का अनुपात (में) कुल ताकतजनसंख्या इकाइयाँ), p द्वारा निरूपित, और उन इकाइयों का अनुपात जिनमें कोई विशेषता नहीं है, q द्वारा, एक वैकल्पिक विशेषता के प्रसरण की गणना की जा सकती है सामान्य नियम. इसके अलावा, p + q = 1, और इसलिए q = 1-p।

सबसे पहले, हम वैकल्पिक सुविधा के औसत मूल्य की गणना करते हैं:

वैकल्पिक सुविधा के औसत मूल्य की गणना करें

,

वे। एक वैकल्पिक विशेषता का माध्य मान उन इकाइयों के अनुपात के बराबर होता है जिनमें यह विशेषता होती है।

वैकल्पिक चिन्ह का प्रसरण इसके बराबर होगा:

इस प्रकार, एक वैकल्पिक विशेषता का प्रसरण उन इकाइयों के अनुपात के गुणनफल के बराबर होता है जिनके पास एक विशेषता होती है, उन इकाइयों के अनुपात से जिनमें यह विशेषता नहीं होती है।

और मानक विचलन = के बराबर होगा।

संकेतक सापेक्ष हैं।एक ही जनसंख्या में विभिन्न लक्षणों के उतार-चढ़ाव की तुलना करने के उद्देश्य से, या कई आबादी में एक ही विशेषता के उतार-चढ़ाव की तुलना करते समय, सापेक्ष शब्दों में व्यक्त भिन्नता संकेतक रुचि के होते हैं। तुलना का आधार अंकगणित माध्य है। इन संकेतकों की गणना भिन्नता की सीमा, माध्य रैखिक विचलन या मानक विचलन से अंकगणितीय माध्य या माध्यिका के अनुपात के रूप में की जाती है।

अक्सर उन्हें प्रतिशत के रूप में व्यक्त किया जाता है और न केवल भिन्नता का तुलनात्मक मूल्यांकन निर्धारित करता है, बल्कि जनसंख्या की एकरूपता को भी दर्शाता है। यदि भिन्नता का गुणांक 33% से अधिक न हो तो समुच्चय को सजातीय माना जाता है। भिन्नता के निम्नलिखित सापेक्ष संकेतक हैं:

1. दोलन का गुणांक औसत के आसपास विशेषता के चरम मूल्यों के सापेक्ष उतार-चढ़ाव को दर्शाता है।

3. भिन्नता का गुणांक माध्य मानों की विशिष्टता का मूल्यांकन करता है।

.

अध्ययन के तहत विशेषता के अनुसार छोटी, अधिक सजातीय जनसंख्या और अधिक विशिष्ट औसत। यदि 33%, तो वितरण सामान्य के करीब है, और जनसंख्या को सजातीय माना जाता है। उपरोक्त उदाहरण से, दूसरा सेट सजातीय है।

प्रसरण के प्रकार और प्रसरण जोड़ने का नियम।संपूर्ण जनसंख्या पर एक विशेषता की भिन्नता का अध्ययन करने के साथ-साथ, अक्सर उन समूहों द्वारा विशेषता में मात्रात्मक परिवर्तनों का पता लगाना आवश्यक होता है जिनमें जनसंख्या विभाजित होती है, साथ ही साथ समूहों के बीच भी। भिन्नता का यह अध्ययन विभिन्न प्रकार के विचरण की गणना और विश्लेषण करके प्राप्त किया जाता है।

इस मामले में, कुल में विशेषता की परिवर्तनशीलता के तीन संकेतक निर्धारित करना संभव है:

1. समग्रता की सामान्य भिन्नता, जो सभी कारणों की कार्रवाई का परिणाम है। इस भिन्नता को कुल विचरण () द्वारा मापा जा सकता है, जो सामान्य औसत से जनसंख्या विशेषता के व्यक्तिगत मूल्यों के विचलन की विशेषता है।

.

2. समूह औसत का परिवर्तन, सामान्य औसत से समूह औसत के विचलन को व्यक्त करना और उस कारक के प्रभाव को दर्शाता है जिसके द्वारा समूह बनाया गया था। इस भिन्नता को तथाकथित अंतरसमूह विचरण (δ2) द्वारा मापा जा सकता है

,

समूह औसत कहाँ हैं, a संपूर्ण जनसंख्या का कुल औसत है, और व्यक्तिगत समूहों की संख्या है।

3. अवशिष्ट (या अंतर-समूह) भिन्नता, जो प्रत्येक समूह में विशेषता के व्यक्तिगत मूल्यों के उनके समूह औसत से विचलन में व्यक्त की जाती है और इसलिए, अंतर्निहित एक को छोड़कर अन्य सभी कारकों के प्रभाव को दर्शाती है समूहन चूँकि प्रत्येक समूह में भिन्नता समूह प्रसरण द्वारा परिलक्षित होती है

,

तो पूरी आबादी के लिए, अवशिष्ट भिन्नता समूह भिन्नताओं के औसत को दर्शाएगी। इस विचरण को इंट्राग्रुप वेरिएंस () का औसत कहा जाता है और इसकी गणना सूत्र द्वारा की जाती है

यह समानता, जिसका एक निश्चित गणितीय प्रमाण है, प्रसरणों को जोड़ने के नियम के रूप में जाना जाता है।

वेरिएंस जोड़ने का नियम आपको इसके घटकों द्वारा कुल विचरण को खोजने की अनुमति देता है, जब विशेषता के व्यक्तिगत मूल्य अज्ञात होते हैं, और केवल समूह संकेतक उपलब्ध होते हैं।

निर्धारण गुणांक।विचरण जोड़ नियम आपको निर्धारण गुणांक का उपयोग करके कुछ कारकों पर परिणामों की निर्भरता की पहचान करने की अनुमति देता है।

यह परिणामी विशेषता की भिन्नता पर समूहन में अंतर्निहित विशेषता के प्रभाव की विशेषता है। सहसंबंध अनुपात 0 से 1 तक भिन्न होता है। यदि , तो समूहीकरण विशेषता परिणामी को प्रभावित नहीं करती है। यदि , तो परिणामी विशेषता केवल समूह में अंतर्निहित विशेषता के आधार पर बदलती है, और अन्य कारक सुविधाओं का प्रभाव शून्य के बराबर होता है।

विषमता और कुर्टोसिस के संकेतक।आर्थिक घटनाओं के क्षेत्र में, कड़ाई से सममित श्रृंखला अत्यंत दुर्लभ है, अधिक बार आपको असममित श्रृंखला से निपटना पड़ता है।

आंकड़ों में, विषमता को चिह्नित करने के लिए कई संकेतकों का उपयोग किया जाता है। यदि हम इस बात को ध्यान में रखते हैं कि एक सममित श्रृंखला में, अंकगणितीय माध्य, बहुलक और माध्यिका के मान में मेल खाता है, तो विषमता का सबसे सरल संकेतक () अंकगणित माध्य और बहुलक के बीच का अंतर होगा, अर्थात।

कुर्टोसिस मान की गणना सूत्र द्वारा की जाती है

यदि >0, तो कर्टोसिस को धनात्मक माना जाता है (वितरण चरम पर होता है), यदि<0, то эксцесс считается отрицательным (распределение низковершинно).

प्रसरण का वर्गमूल माध्य से मानक विचलन कहलाता है, जिसकी गणना निम्न प्रकार से की जाती है:

मानक विचलन सूत्र का एक प्रारंभिक बीजगणितीय परिवर्तन इसे निम्न रूप में लाता है:

गणना के अभ्यास में यह सूत्र अक्सर अधिक सुविधाजनक होता है।

मानक विचलन, साथ ही औसत रैखिक विचलन, यह दर्शाता है कि विशेषता के विशिष्ट मान उनके औसत मूल्य से औसतन कितना विचलन करते हैं। मानक विचलन हमेशा औसत रैखिक विचलन से अधिक होता है। उनके बीच एक रिश्ता है:

इस अनुपात को जानकर, ज्ञात संकेतकों से अज्ञात का निर्धारण करना संभव है, उदाहरण के लिए, लेकिन (मैं गणना और इसके विपरीत। मानक विचलन विशेषता उतार-चढ़ाव के पूर्ण आकार को मापता है और उसी इकाइयों में विशेषता मान (रूबल, टन, वर्ष, आदि) के रूप में व्यक्त किया जाता है। यह भिन्नता का एक निरपेक्ष माप है।

के लिये वैकल्पिक सुविधाएँ, उदाहरण के लिए, उच्च शिक्षा, बीमा, फैलाव और मानक विचलन सूत्र की उपस्थिति या अनुपस्थिति इस प्रकार है:

आइए हम एक असतत श्रृंखला के आंकड़ों के अनुसार मानक विचलन की गणना दिखाते हैं जो विश्वविद्यालय के किसी एक संकाय के छात्रों की उम्र के अनुसार वितरण की विशेषता है (तालिका 6.2)।

तालिका 6.2।

सहायक गणना के परिणाम तालिका के कॉलम 2-5 में दिए गए हैं। 6.2.

एक छात्र की औसत आयु, वर्ष, भारित अंकगणितीय माध्य सूत्र (स्तंभ 2) द्वारा निर्धारित की जाती है:

औसत से छात्र की व्यक्तिगत आयु के विचलन के वर्ग कॉलम 3-4 में निहित हैं, और संबंधित आवृत्तियों द्वारा विचलन के वर्गों के उत्पाद कॉलम 5 में हैं।

छात्रों की आयु का फैलाव, वर्ष, हम सूत्र (6.2) द्वारा पाते हैं:

फिर ओ \u003d एल / 3.43 1.85 * ओडा, यानी। विद्यार्थी की आयु का प्रत्येक विशिष्ट मान औसत मान से 1.85 वर्ष विचलित हो जाता है।

भिन्नता का गुणांक

अपने निरपेक्ष मूल्य में, मानक विचलन न केवल विशेषता की भिन्नता की डिग्री पर निर्भर करता है, बल्कि वेरिएंट के निरपेक्ष स्तर और औसत पर भी निर्भर करता है। इसलिए, विभिन्न औसत स्तरों के साथ भिन्नता श्रृंखला के मानक विचलन की सीधे तुलना करना असंभव है। इस तरह की तुलना करने में सक्षम होने के लिए, आपको अंकगणितीय माध्य में औसत विचलन (रैखिक या द्विघात) का हिस्सा ज्ञात करना होगा, जिसे प्रतिशत के रूप में व्यक्त किया जाता है, अर्थात। calculate भिन्नता के सापेक्ष संकेतक।

भिन्नता का रैखिक गुणांक सूत्र के अनुसार गणना

भिन्नता का गुणांक निम्नलिखित सूत्र द्वारा निर्धारित किया जाता है:

भिन्नता के गुणांकों में, न केवल अध्ययन के तहत विशेषता के मापन की विभिन्न इकाइयों से जुड़ी असंगति को समाप्त किया जाता है, बल्कि अंकगणितीय साधनों के मूल्य में अंतर से उत्पन्न होने वाली असंगति को भी समाप्त किया जाता है। इसके अलावा, भिन्नता के संकेतक जनसंख्या की एकरूपता की विशेषता देते हैं। यदि भिन्नता का गुणांक 33% से अधिक न हो तो समुच्चय को सजातीय माना जाता है।

तालिका के अनुसार। 6.2 और ऊपर प्राप्त गणनाओं के परिणाम, हम सूत्र (6.3) के अनुसार भिन्नता के गुणांक,% का निर्धारण करते हैं:

यदि भिन्नता का गुणांक 33% से अधिक है, तो यह अध्ययन की गई जनसंख्या की विविधता को इंगित करता है। हमारे मामले में प्राप्त मूल्य इंगित करता है कि आयु के अनुसार छात्रों की जनसंख्या संरचना में सजातीय है। इस प्रकार, भिन्नता के सामान्यीकरण संकेतकों का एक महत्वपूर्ण कार्य औसत की विश्वसनीयता का आकलन है। कम c1, a2 और वी, घटनाओं का परिणामी सेट जितना अधिक सजातीय होगा और प्राप्त औसत उतना ही विश्वसनीय होगा। गणितीय आँकड़ों द्वारा माने गए "तीन सिग्मा के नियम" के अनुसार, सामान्य रूप से वितरित या उनके करीब श्रृंखला में, अंकगणितीय माध्य से विचलन, ± 3 से अधिक नहीं, 1000 में से 997 मामलों में होते हैं। इस प्रकार, जानना एक्स और ए, आप भिन्नता श्रृंखला का एक सामान्य प्रारंभिक विचार प्राप्त कर सकते हैं। यदि, उदाहरण के लिए, कंपनी में एक कर्मचारी का औसत वेतन 25,000 रूबल था, और 100 रूबल है, तो विश्वसनीयता के करीब संभावना के साथ, यह तर्क दिया जा सकता है कि कंपनी के कर्मचारियों के वेतन में उतार-चढ़ाव होता है (25,000 ± 3 एक्स 100) यानी 24,700 से 25,300 रूबल तक।

 

कृपया इस लेख को सोशल मीडिया पर साझा करें यदि यह मददगार था!