विश्वास अंतराल। चिकित्सा सांख्यिकी की एबीसी। अध्याय III

विश्वास अंतराल का अनुमान

सीखने के मकसद

आंकड़े निम्नलिखित पर विचार करते हैं दो मुख्य कार्य:

    हमारे पास नमूना डेटा के आधार पर कुछ अनुमान हैं और हम अनुमान लगाने वाले पैरामीटर का सही मूल्य कहां है, इसके बारे में कुछ संभाव्य बयान देना चाहते हैं।

    हमारे पास एक विशिष्ट परिकल्पना है जिसे नमूना डेटा के आधार पर परीक्षण करने की आवश्यकता है।

इस विषय में, हम पहली समस्या पर विचार करते हैं। हम एक कॉन्फिडेंस इंटरवल की परिभाषा भी पेश करते हैं।

कॉन्फिडेंस इंटरवल एक ऐसा अंतराल है जो एक पैरामीटर के अनुमानित मूल्य के आसपास बनाया गया है और यह दर्शाता है कि अनुमानित पैरामीटर का सही मूल्य एक प्राथमिकता दी गई संभावना के साथ कहां है।

इस विषय पर सामग्री का अध्ययन करने के बाद, आप:

    जानें कि अनुमान का विश्वास अंतराल क्या है;

    सांख्यिकीय समस्याओं को वर्गीकृत करना सीखें;

    सांख्यिकीय फ़ार्मुलों का उपयोग करके और सॉफ़्टवेयर टूल का उपयोग करके, विश्वास अंतराल के निर्माण की तकनीक में महारत हासिल करें;

    पहचानना सीखो आवश्यक आयामसांख्यिकीय अनुमानों की सटीकता के कुछ मापदंडों को प्राप्त करने के लिए नमूने।

नमूना विशेषताओं का वितरण

टी वितरण

जैसा कि ऊपर चर्चा की गई है, वितरण अनियमित चरपैरामीटर 0 और 1 के साथ एक मानकीकृत सामान्य वितरण के करीब। चूंकि हम σ का मान नहीं जानते हैं, इसलिए हम इसे कुछ अनुमान s से बदल देते हैं। मात्रा का पहले से ही एक अलग वितरण है, अर्थात्, या छात्र का वितरण, जो पैरामीटर n -1 (स्वतंत्रता की डिग्री की संख्या) द्वारा निर्धारित किया जाता है। यह वितरण सामान्य वितरण के करीब है (बड़ा n, वितरण के करीब)।

अंजीर पर। 95
30 डिग्री स्वतंत्रता के साथ छात्र का वितरण प्रस्तुत किया गया है। जैसा कि आप देख सकते हैं, यह सामान्य वितरण के बहुत करीब है।

सामान्य वितरण NORMDIST और NORMINV के साथ काम करने के कार्यों के समान, t-वितरण के साथ काम करने के लिए कार्य हैं - STUDIST (TDIST) और STUDRSPBR (TINV). इन कार्यों के उपयोग का एक उदाहरण STUDRIST.XLS फ़ाइल (टेम्पलेट और समाधान) और अंजीर में पाया जा सकता है। 96
.

अन्य विशेषताओं का वितरण

जैसा कि हम पहले से ही जानते हैं, उम्मीद अनुमान की सटीकता निर्धारित करने के लिए, हमें टी-वितरण की आवश्यकता है। अन्य मापदंडों का अनुमान लगाने के लिए, जैसे विचरण, अन्य वितरणों की आवश्यकता होती है। उनमें से दो एफ-वितरण हैं और एक्स 2-वितरण.

माध्य के लिए विश्वास अंतराल

विश्वास अंतरालएक अंतराल है जो पैरामीटर के अनुमानित मूल्य के आसपास बनाया गया है और दिखाता है कि अनुमानित पैरामीटर का सही मूल्य एक प्राथमिकता दी गई संभावना के साथ कहां है।

माध्य मान के लिए एक विश्वास अंतराल का निर्माण होता है इस अनुसार:

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक ने उन लोगों में से 40 आगंतुकों का बेतरतीब ढंग से चयन करने की योजना बनाई है, जिन्होंने पहले से ही इसे आजमाया है और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहते हैं। प्रबंधक अनुमान लगाना चाहता है नए उत्पाद को प्राप्त होने वाले अंकों की अपेक्षित संख्या और इस अनुमान के लिए 95% विश्वास अंतराल का निर्माण करेगी। यह कैसे करना है? (देखें फ़ाइल SANDWICH1.XLS (टेम्पलेट और समाधान)।

समाधान

इस समस्या को हल करने के लिए, आप उपयोग कर सकते हैं। परिणाम को आंकड़े में दर्शाया गया है। 97
.

कुल मान के लिए कॉन्फिडेंस इंटरवल

कभी-कभी, नमूना डेटा के अनुसार, अनुमान लगाने की आवश्यकता नहीं होती है अपेक्षित मूल्य, लेकिन मूल्यों का कुल योग। उदाहरण के लिए, एक लेखा परीक्षक की स्थिति में, यह आकलन करने के लिए रुचि का हो सकता है कि नहीं मध्यम आकारखातों, लेकिन सभी खातों की राशि।

एन को तत्वों की कुल संख्या होने दें, एन नमूना आकार हो, टी 3 नमूने में मूल्यों का योग हो, टी "पूरी आबादी पर योग का अनुमान हो, फिर , और विश्वास अंतराल की गणना सूत्र द्वारा की जाती है, जहां s नमूने के लिए मानक विचलन का अनुमान है, नमूने के माध्य का अनुमान है।

उदाहरण

मान लें कि एक कर कार्यालय 10,000 करदाताओं के लिए कुल कर वापसी की राशि का अनुमान लगाना चाहता है। करदाता या तो धनवापसी प्राप्त करता है या अतिरिक्त करों का भुगतान करता है। 500 लोगों का नमूना आकार मानकर, धनवापसी राशि के लिए 95% विश्वास अंतराल का पता लगाएं (देखें फ़ाइल REFUND AMOUNT.XLS (टेम्पलेट और समाधान)।

समाधान

इस मामले के लिए StatPro में कोई विशेष प्रक्रिया नहीं है, हालाँकि, आप देख सकते हैं कि उपरोक्त सूत्रों का उपयोग करके माध्य के लिए सीमा से सीमाएँ प्राप्त की जा सकती हैं (चित्र 98)।
).

अनुपात के लिए विश्वास अंतराल

मान लीजिए कि p ग्राहकों के हिस्से की अपेक्षा है, और pv इस शेयर का एक अनुमान है, जो आकार n के नमूने से प्राप्त होता है। यह दिखाया जा सकता है कि पर्याप्त रूप से बड़े के लिए अनुमान वितरण औसत पी और मानक विचलन के साथ सामान्य के करीब होगा . इस मामले में अनुमान की मानक त्रुटि के रूप में व्यक्त किया जाता है , और विश्वास अंतराल के रूप में .

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक ने बेतरतीब ढंग से उन लोगों में से 40 आगंतुकों का चयन किया, जिन्होंने पहले से ही इसे आजमाया था और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहा। प्रबंधक अपेक्षित अनुपात का अनुमान लगाना चाहता है। उन ग्राहकों की संख्या जो नए उत्पाद को कम से कम 6 अंक से अधिक रेट करते हैं (उन्हें उम्मीद है कि ये ग्राहक नए उत्पाद के उपभोक्ता होंगे)।

समाधान

प्रारंभ में, हम 1 के आधार पर एक नया कॉलम बनाते हैं यदि क्लाइंट का स्कोर 6 अंक से अधिक था और अन्यथा 0 (SANDWICH2.XLS फ़ाइल (टेम्पलेट और समाधान देखें) देखें।

विधि 1

1 की राशि की गणना करते हुए, हम हिस्से का अनुमान लगाते हैं, और फिर हम सूत्रों का उपयोग करते हैं।

z करोड़ का मान विशेष सामान्य वितरण तालिकाओं से लिया जाता है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।

95% अंतराल बनाने के लिए इस दृष्टिकोण और विशिष्ट डेटा का उपयोग करके, हम निम्नलिखित परिणाम प्राप्त करते हैं (चित्र 99 .)
) पैरामीटर z करोड़ का महत्वपूर्ण मान 1.96 है। अनुमान की मानक त्रुटि 0.077 है। विश्वास अंतराल की निचली सीमा 0.475 है। विश्वास अंतराल की ऊपरी सीमा 0.775 है। इस प्रकार, एक प्रबंधक 95% निश्चितता के साथ यह मान सकता है कि किसी नए उत्पाद को 6 अंक या अधिक रेट करने वाले ग्राहकों का प्रतिशत 47.5 और 77.5 के बीच होगा।

विधि 2

इस समस्या को मानक StatPro टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, यह नोट करना पर्याप्त है कि इस मामले में शेयर टाइप कॉलम के औसत मूल्य के साथ मेल खाता है। अगला आवेदन StatPro/सांख्यिकीय अनुमान/एक-नमूना विश्लेषणटाइप कॉलम के लिए माध्य मान (अपेक्षा अनुमान) के लिए एक विश्वास अंतराल बनाने के लिए। इस मामले में प्राप्त परिणाम पहली विधि (छवि 99) के परिणाम के बहुत करीब होंगे।

मानक विचलन के लिए विश्वास अंतराल

s का उपयोग मानक विचलन के अनुमान के रूप में किया जाता है (सूत्र खंड 1 में दिया गया है)। अनुमान s का घनत्व फलन ची-वर्ग फलन है, जिसमें t-वितरण की तरह स्वतंत्रता की n-1 डिग्री है। इस वितरण CHI2DIST (CHIDIST) और CHI2OBR (CHIINV) के साथ काम करने के लिए विशेष कार्य हैं।

इस मामले में विश्वास अंतराल अब सममित नहीं होगा। सीमाओं की सशर्त योजना अंजीर में दिखाई गई है। 100.

उदाहरण

मशीन को 10 सेमी के व्यास के साथ भागों का उत्पादन करना चाहिए हालांकि, विभिन्न परिस्थितियों के कारण त्रुटियां होती हैं। गुणवत्ता नियंत्रक दो चीजों के बारे में चिंतित है: पहला, औसत मूल्य 10 सेमी होना चाहिए; दूसरे, इस मामले में भी, यदि विचलन बड़े हैं, तो कई विवरण अस्वीकार कर दिए जाएंगे। हर दिन वह 50 भागों का एक नमूना बनाता है (फ़ाइल गुणवत्ता नियंत्रण देखें। XLS (टेम्पलेट और समाधान)। ऐसा नमूना क्या निष्कर्ष दे सकता है?

समाधान

हम माध्य के लिए और मानक विचलन के लिए 95% विश्वास अंतराल का निर्माण करते हैं StatPro/सांख्यिकीय अनुमान/एक-नमूना विश्लेषण(चित्र 101
).

इसके अलावा, व्यास के सामान्य वितरण की धारणा का उपयोग करते हुए, हम दोषपूर्ण उत्पादों के अनुपात की गणना करते हैं, 0.065 का अधिकतम विचलन निर्धारित करते हैं। लुकअप टेबल (दो मापदंडों का मामला) की क्षमताओं का उपयोग करके, हम माध्य मान और मानक विचलन (चित्र। 102) पर अस्वीकृति के प्रतिशत की निर्भरता का निर्माण करते हैं।
).

दो साधनों के अंतर के लिए कॉन्फिडेंस इंटरवल

यह सांख्यिकीय विधियों के सबसे महत्वपूर्ण अनुप्रयोगों में से एक है। स्थिति उदाहरण।

    एक कपड़े की दुकान प्रबंधक यह जानना चाहेगा कि औसत महिला खरीदार एक पुरुष की तुलना में दुकान में कितना अधिक या कम खर्च करती है।

    दोनों एयरलाइंस समान मार्गों पर उड़ान भरती हैं। एक उपभोक्ता संगठन दोनों एयरलाइनों के लिए औसत अपेक्षित उड़ान विलंब समय के बीच अंतर की तुलना करना चाहेगा।

    कंपनी कूपन भेजती है ख़ास तरह केएक शहर में माल और दूसरे में नहीं भेजता है। प्रबंधक अगले दो महीनों में इन वस्तुओं की औसत खरीद की तुलना करना चाहते हैं।

    एक कार डीलर अक्सर प्रस्तुतियों में विवाहित जोड़ों के साथ व्यवहार करता है। प्रस्तुति के प्रति उनकी व्यक्तिगत प्रतिक्रियाओं को समझने के लिए, जोड़ों का अक्सर अलग-अलग साक्षात्कार किया जाता है। प्रबंधक पुरुषों और महिलाओं द्वारा दी गई रेटिंग में अंतर का मूल्यांकन करना चाहता है।

हो रहा स्वतंत्र नमूने

माध्य अंतर में n 1 + n 2 - 2 डिग्री स्वतंत्रता के साथ t-वितरण होगा। μ 1 - μ 2 के लिए विश्वास अंतराल अनुपात द्वारा व्यक्त किया जाता है:

इस समस्या को न केवल उपरोक्त सूत्रों द्वारा हल किया जा सकता है, बल्कि मानक स्टेटप्रो टूल द्वारा भी हल किया जा सकता है। ऐसा करने के लिए, यह लागू करने के लिए पर्याप्त है

अनुपात के बीच अंतर के लिए विश्वास अंतराल

आइए शेयरों की गणितीय अपेक्षा करें। आज्ञा देना उनके नमूना अनुमान क्रमशः आकार n 1 और n 2 के नमूनों पर बनाया गया है। फिर अंतर के लिए एक अनुमान है। इसलिए, इस अंतर के लिए विश्वास अंतराल इस प्रकार व्यक्त किया जाता है:

यहाँ z cr विशेष तालिकाओं के सामान्य वितरण से प्राप्त मूल्य है (उदाहरण के लिए, 95% विश्वास अंतराल के लिए 1.96)।

अनुमान की मानक त्रुटि इस मामले में संबंध द्वारा व्यक्त की जाती है:

.

उदाहरण

बड़ी बिक्री की तैयारी में स्टोर ने निम्नलिखित विपणन अनुसंधान किया। शीर्ष 300 खरीदारों का चयन किया गया और बेतरतीब ढंग से 150 सदस्यों के दो समूहों में विभाजित किया गया। सभी चयनित खरीदारों को बिक्री में भाग लेने के लिए निमंत्रण भेजा गया था, लेकिन केवल पहले समूह के सदस्यों के लिए 5% छूट का अधिकार देने वाला एक कूपन संलग्न किया गया था। सेल के दौरान सभी चयनित 300 खरीदारों की खरीदारी दर्ज की गई। एक प्रबंधक परिणामों की व्याख्या कैसे कर सकता है और कूपनिंग की प्रभावशीलता के बारे में निर्णय कैसे ले सकता है? (देखें कूपन.एक्सएलएस फ़ाइल (टेम्पलेट और समाधान))।

समाधान

हमारे विशेष मामले के लिए, छूट कूपन प्राप्त करने वाले 150 ग्राहकों में से 55 ने बिक्री पर खरीदारी की, और 150 में से जिन्हें कूपन प्राप्त नहीं हुआ, केवल 35 ने खरीदारी की (चित्र 103)
) तब नमूना अनुपात का मान क्रमशः 0.3667 और 0.2333 है। और उनके बीच नमूना अंतर क्रमशः 0.1333 के बराबर है। 95% के विश्वास अंतराल को मानते हुए, हम सामान्य वितरण तालिका z cr = 1.96 से पाते हैं। नमूना अंतर की मानक त्रुटि की गणना 0.0524 है। अंत में, हम पाते हैं कि 95% विश्वास अंतराल की निचली सीमा क्रमशः 0.0307 है, और ऊपरी सीमा क्रमशः 0.2359 है। प्राप्त परिणामों की व्याख्या इस तरह से की जा सकती है कि छूट कूपन प्राप्त करने वाले प्रत्येक 100 ग्राहकों के लिए, हम 3 से 23 नए ग्राहकों की अपेक्षा कर सकते हैं। हालांकि, हमें यह ध्यान रखना चाहिए कि इस निष्कर्ष का मतलब अभी तक कूपन के उपयोग की प्रभावशीलता नहीं है (क्योंकि छूट प्रदान करने से, हम लाभ खो देते हैं!) आइए इसे विशिष्ट डेटा पर प्रदर्शित करें। मान लीजिए कि औसत खरीद राशि 400 रूबल है, जिसमें से 50 रूबल। एक स्टोर लाभ है। फिर प्रति 100 ग्राहकों पर अपेक्षित लाभ, जिन्हें कूपन नहीं मिला, के बराबर है:

50 0.2333 100 \u003d 1166.50 रूबल।

कूपन प्राप्त करने वाले 100 खरीदारों के लिए समान गणना दें:

30 0.3667 100 \u003d 1100.10 रूबल।

औसत लाभ में 30 की कमी को इस तथ्य से समझाया गया है कि छूट का उपयोग करके, कूपन प्राप्त करने वाले खरीदार औसतन 380 रूबल की खरीदारी करेंगे।

इस प्रकार, अंतिम निष्कर्ष इस विशेष स्थिति में ऐसे कूपन का उपयोग करने की अक्षमता को इंगित करता है।

टिप्पणी। इस समस्या को मानक StatPro टूल का उपयोग करके हल किया जा सकता है। ऐसा करने के लिए, यह इस समस्या को कम करने के लिए विधि द्वारा दो औसत के अंतर का अनुमान लगाने की समस्या को कम करने के लिए पर्याप्त है, और फिर लागू करें StatPro/सांख्यिकीय अनुमान/दो-नमूना विश्लेषणदो माध्य मानों के बीच अंतर के लिए एक विश्वास अंतराल बनाने के लिए।

कॉन्फिडेंस इंटरवल कंट्रोल

विश्वास अंतराल की लंबाई निर्भर करती है निम्नलिखित शर्तें:

    सीधे डेटा (मानक विचलन);

    सार्थक तल;

    नमूने का आकार।

माध्य का अनुमान लगाने के लिए नमूना आकार

आइए पहले सामान्य मामले में समस्या पर विचार करें। आइए हम दिए गए विश्वास अंतराल की आधी लंबाई के मान को B (चित्र 104 .) के रूप में निरूपित करें
) हम जानते हैं कि कुछ यादृच्छिक चर X के माध्य मान के लिए विश्वास अंतराल को इस प्रकार व्यक्त किया जाता है , कहाँ पे . यह मानते हुए:

और n व्यक्त करते हुए, हम प्राप्त करते हैं।

दुर्भाग्य से, सही मूल्यहम यादृच्छिक चर X के प्रसरण को नहीं जानते हैं। इसके अलावा, हम t करोड़ के मूल्य को नहीं जानते हैं क्योंकि यह स्वतंत्रता की डिग्री की संख्या के माध्यम से n पर निर्भर करता है। इस स्थिति में, हम निम्न कार्य कर सकते हैं। प्रसरण s के बजाय, हम अध्ययन के तहत यादृच्छिक चर के कुछ उपलब्ध अहसासों के लिए विचरण के कुछ अनुमान का उपयोग करते हैं। t cr मान के बजाय, हम सामान्य वितरण के लिए z cr मान का उपयोग करते हैं। यह काफी स्वीकार्य है, क्योंकि सामान्य और टी-वितरण के लिए घनत्व कार्य बहुत करीब हैं (छोटे n के मामले को छोड़कर)। इस प्रकार, वांछित सूत्र रूप लेता है:

.

चूंकि सूत्र देता है, आम तौर पर बोलते हुए, गैर-पूर्णांक परिणाम, परिणाम की अधिकता के साथ गोल करना वांछित नमूना आकार के रूप में लिया जाता है।

उदाहरण

फास्ट फूड रेस्तरां एक नए प्रकार के सैंडविच के साथ अपने वर्गीकरण का विस्तार करने की योजना बना रहा है। इसकी मांग का अनुमान लगाने के लिए, प्रबंधक बेतरतीब ढंग से उन लोगों में से कई आगंतुकों का चयन करने की योजना बना रहा है, जिन्होंने पहले से ही इसे आजमाया है, और उन्हें 1 से 10 के पैमाने पर नए उत्पाद के प्रति अपने दृष्टिकोण को रेट करने के लिए कहें। प्रबंधक चाहता है नए उत्पाद को प्राप्त होने वाले अंकों की अपेक्षित संख्या का अनुमान लगाने के लिए उत्पाद और उस अनुमान के 95% विश्वास अंतराल को प्लॉट करें। हालांकि, वह चाहता है कि कॉन्फिडेंस इंटरवल की आधी चौड़ाई 0.3 से अधिक न हो। उसे मतदान करने के लिए कितने आगंतुकों की आवश्यकता है?

निम्नलिखित नुसार:

यहां आर ओटीएसअंश p का एक अनुमान है, और B विश्वास अंतराल की लंबाई का आधा दिया गया है। एन के लिए एक फुलाया हुआ मूल्य मूल्य का उपयोग करके प्राप्त किया जा सकता है आर ओटीएस= 0.5. इस मामले में, विश्वास अंतराल की लंबाई p के किसी भी वास्तविक मान के लिए दिए गए मान B से अधिक नहीं होगी।

उदाहरण

पिछले उदाहरण से प्रबंधक को उन ग्राहकों के अनुपात का अनुमान लगाने की योजना बनाएं जो एक नए प्रकार के उत्पाद को पसंद करते हैं। वह 90% विश्वास अंतराल बनाना चाहता है जिसकी आधी लंबाई 0.05 से कम या उसके बराबर हो। यादृच्छिक रूप से कितने ग्राहकों का नमूना लिया जाना चाहिए?

समाधान

हमारे मामले में, z करोड़ का मान = 1.645। इसलिए, आवश्यक मात्रा की गणना इस प्रकार की जाती है .

यदि प्रबंधक के पास यह मानने का कारण था कि p का वांछित मान, उदाहरण के लिए, लगभग 0.3 है, तो इस मान को उपरोक्त सूत्र में प्रतिस्थापित करने पर, हमें यादृच्छिक नमूने का एक छोटा मान प्राप्त होगा, अर्थात् 228।

निर्धारित करने का सूत्र यादृच्छिक नमूना आकार दो साधनों के बीच अंतर के मामले मेंके रूप में लिखा है:

.

उदाहरण

कुछ कंप्यूटर कंपनी का एक ग्राहक सेवा केंद्र है। हाल ही में, सेवा की खराब गुणवत्ता के बारे में ग्राहकों की शिकायतों की संख्या में वृद्धि हुई है। पर सवा केंद्रमूल रूप से, दो प्रकार के कर्मचारी काम करते हैं: जिनके पास अधिक अनुभव नहीं है, लेकिन विशेष तैयारी पाठ्यक्रम पूरा कर चुके हैं, और जिनके पास व्यापक व्यावहारिक अनुभव है, लेकिन विशेष पाठ्यक्रम पूरा नहीं किया है। कंपनी पिछले छह महीनों में ग्राहकों की शिकायतों का विश्लेषण करना चाहती है और कर्मचारियों के दो समूहों में से प्रत्येक की औसत संख्या की तुलना करना चाहती है। यह माना जाता है कि दोनों समूहों के नमूनों में संख्या समान होगी। 95% अंतराल प्राप्त करने के लिए नमूने में कितने कर्मचारियों को शामिल किया जाना चाहिए, जिसकी आधी लंबाई 2 से अधिक नहीं है?

समाधान

यहां ots दोनों यादृच्छिक चरों के मानक विचलन का अनुमान है, इस धारणा के तहत कि वे करीब हैं। इस प्रकार, हमारे कार्य में, हमें किसी तरह यह अनुमान प्राप्त करने की आवश्यकता है। यह किया जा सकता है, उदाहरण के लिए, इस प्रकार है। पिछले छह महीनों में ग्राहक शिकायत डेटा को देखते हुए, एक प्रबंधक यह देख सकता है कि आम तौर पर प्रति कर्मचारी 6 से 36 शिकायतें होती हैं। यह जानते हुए कि एक सामान्य वितरण के लिए, लगभग सभी मूल्यों को माध्य से तीन से अधिक नहीं हटा दिया जाता है मानक विचलन, वह यथोचित रूप से विश्वास कर सकता है कि:

, जहां से ots = 5.

इस मान को सूत्र में प्रतिस्थापित करने पर, हम प्राप्त करते हैं .

निर्धारित करने का सूत्र शेयरों के बीच अंतर का अनुमान लगाने के मामले में एक यादृच्छिक नमूने का आकारकी तरह लगता है:

उदाहरण

कुछ कंपनी के समान उत्पादों के उत्पादन के लिए दो कारखाने हैं। एक कंपनी का प्रबंधक दोनों कारखानों की दोष दरों की तुलना करना चाहता है। उपलब्ध जानकारी के अनुसार, दोनों कारखानों में अस्वीकृति दर 3 से 5% तक है। इसे 99% कॉन्फिडेंस इंटरवल बनाना चाहिए जिसकी आधी लंबाई 0.005 (या 0.5%) से अधिक न हो। प्रत्येक कारखाने से कितने उत्पादों का चयन किया जाना चाहिए?

समाधान

यहाँ p 1ot और p 2ot पहली और दूसरी फैक्ट्रियों में अस्वीकार के दो अज्ञात अंशों का अनुमान है। यदि हम p 1ots \u003d p 2ots \u003d 0.5 डालते हैं, तो हमें n के लिए एक overestimated मान मिलेगा। लेकिन चूंकि हमारे मामले में हमारे पास इन शेयरों के बारे में कुछ प्राथमिक जानकारी है, इसलिए हम इन शेयरों का ऊपरी अनुमान, अर्थात् 0.05 लेते हैं। हम पाते हैं

नमूना डेटा से कुछ जनसंख्या मापदंडों का आकलन करते समय, न केवल पैरामीटर का एक बिंदु अनुमान प्रदान करना उपयोगी होता है, बल्कि एक आत्मविश्वास अंतराल भी होता है जो इंगित करता है कि अनुमानित पैरामीटर का सटीक मूल्य कहां हो सकता है।

इस अध्याय में, हम मात्रात्मक संबंधों से भी परिचित हुए हैं जो हमें विभिन्न मापदंडों के लिए ऐसे अंतराल बनाने की अनुमति देते हैं; आत्मविश्वास अंतराल की लंबाई को नियंत्रित करने के तरीके सीखे।

हम यह भी नोट करते हैं कि नमूना आकार (प्रयोग नियोजन समस्या) का अनुमान लगाने की समस्या को मानक स्टेटप्रो टूल्स का उपयोग करके हल किया जा सकता है, अर्थात् StatPro/सांख्यिकीय अनुमान/नमूना आकार चयन.

आवृत्तियों और भागों के लिए विश्वास अंतराल

© 2008

सार्वजनिक स्वास्थ्य के राष्ट्रीय संस्थान, ओस्लो, नॉर्वे

लेख वाल्ड, विल्सन, क्लॉपर-पियर्सन के तरीकों का उपयोग करके आवृत्तियों और अनुपात के लिए आत्मविश्वास अंतराल की गणना का वर्णन और चर्चा करता है, कोणीय परिवर्तन और वाल्ड की विधि एग्रेस्टी-कोल सुधार का उपयोग करता है। प्रस्तुत सामग्री देता है सामान्य जानकारीआवृत्तियों और अनुपातों के लिए आत्मविश्वास अंतराल की गणना के तरीकों के बारे में और इसका उद्देश्य पत्रिका के पाठकों की रुचि न केवल अपने स्वयं के शोध के परिणामों को प्रस्तुत करते समय आत्मविश्वास अंतराल का उपयोग करना है, बल्कि भविष्य के प्रकाशनों पर काम शुरू करने से पहले विशेष साहित्य पढ़ने में भी है।

कीवर्ड: आत्मविश्वास अंतराल, आवृत्ति, अनुपात

पिछले प्रकाशनों में से एक में, गुणात्मक डेटा के विवरण का संक्षेप में उल्लेख किया गया था और यह बताया गया था कि सामान्य आबादी में अध्ययन की गई विशेषता की आवृत्ति का वर्णन करने के लिए उनके अंतराल अनुमान एक बिंदु अनुमान के लिए बेहतर है। वास्तव में, चूंकि अध्ययन नमूना डेटा का उपयोग करके किए जाते हैं, सामान्य आबादी पर परिणामों के प्रक्षेपण में नमूना अनुमान में अशुद्धि का एक तत्व होना चाहिए। विश्वास अंतराल अनुमानित पैरामीटर की सटीकता का एक उपाय है। यह दिलचस्प है कि चिकित्सकों के लिए आंकड़ों की मूल बातें पर कुछ पुस्तकों में, आवृत्तियों के लिए आत्मविश्वास अंतराल के विषय को पूरी तरह से अनदेखा किया जाता है। इस लेख में, हम आवृत्ति के लिए विश्वास अंतराल की गणना करने के कई तरीकों पर विचार करेंगे, नमूना विशेषताओं जैसे कि गैर-पुनरावृत्ति और प्रतिनिधित्व, साथ ही एक दूसरे से टिप्पणियों की स्वतंत्रता को मानते हुए। इस लेख में आवृत्ति को एक निरपेक्ष संख्या के रूप में नहीं समझा जाता है, यह दर्शाता है कि यह या वह मान कितनी बार कुल में होता है, लेकिन एक सापेक्ष मूल्य जो अध्ययन के तहत विशेषता वाले अध्ययन प्रतिभागियों के अनुपात को निर्धारित करता है।

बायोमेडिकल रिसर्च में, 95% कॉन्फिडेंस इंटरवल का सबसे अधिक उपयोग किया जाता है। यह विश्वास अंतराल वह क्षेत्र है जिसके भीतर वास्तविक अनुपात 95% बार गिरता है। दूसरे शब्दों में, यह 95% निश्चितता के साथ कहा जा सकता है कि सामान्य जनसंख्या में किसी विशेषता के घटित होने की आवृत्ति का सही मूल्य 95% विश्वास अंतराल के भीतर होगा।

चिकित्सा शोधकर्ताओं के लिए अधिकांश सांख्यिकीय पाठ्यपुस्तकें रिपोर्ट करती हैं कि आवृत्ति त्रुटि की गणना सूत्र का उपयोग करके की जाती है

जहाँ p नमूने में विशेषता के घटित होने की आवृत्ति है (मान 0 से 1 तक)। अधिकांश घरेलू में वैज्ञानिक लेखनमूना (पी) में विशेषता की घटना की आवृत्ति का मूल्य इंगित किया गया है, साथ ही साथ इसकी त्रुटि (एस) पी ± एस के रूप में है। हालांकि, सामान्य आबादी में एक विशेषता की घटना की आवृत्ति के लिए 95% विश्वास अंतराल प्रस्तुत करना अधिक समीचीन है, जिसमें मूल्य शामिल होंगे

इससे पहले।

कुछ पाठ्यपुस्तकों में, छोटे नमूनों के लिए, 1.96 के मान को t के मान से बदलने की अनुशंसा की जाती है, जहां N - 1 डिग्री की स्वतंत्रता है, जहां N नमूने में टिप्पणियों की संख्या है। t का मान t-वितरण के लिए तालिकाओं में पाया जाता है, जो सांख्यिकी पर लगभग सभी पाठ्यपुस्तकों में उपलब्ध हैं। वाल्ड विधि के लिए टी के वितरण का उपयोग नीचे चर्चा की गई अन्य विधियों पर दृश्य लाभ प्रदान नहीं करता है, और इसलिए कुछ लेखकों द्वारा इसका स्वागत नहीं किया जाता है।

आवृत्तियों या अनुपातों के लिए आत्मविश्वास अंतराल की गणना के लिए उपरोक्त विधि का नाम अब्राहम वाल्ड (अब्राहम वाल्ड, 1902-1950) के नाम पर रखा गया है, क्योंकि 1939 में वाल्ड और वोल्फोविट्ज के प्रकाशन के बाद इसका व्यापक रूप से उपयोग किया जाने लगा। हालाँकि, यह विधि स्वयं पियरे साइमन लाप्लास (1749-1827) द्वारा 1812 की शुरुआत में प्रस्तावित की गई थी।

वाल्ड विधि बहुत लोकप्रिय है, लेकिन इसका अनुप्रयोग महत्वपूर्ण समस्याओं से जुड़ा है। छोटे नमूना आकारों के लिए विधि की अनुशंसा नहीं की जाती है, साथ ही ऐसे मामलों में जहां किसी विशेषता की आवृत्ति की आवृत्ति 0 या 1 (0% या 100%) हो जाती है और 0 और 1 की आवृत्तियों के लिए संभव नहीं है। इसके अलावा, सामान्य वितरण सन्निकटन, जिसका उपयोग त्रुटि की गणना करते समय किया जाता है, उन मामलों में "काम नहीं करता" जहां n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

चूंकि नया चर सामान्य रूप से वितरित किया जाता है, चर φ के लिए 95% विश्वास अंतराल की निचली और ऊपरी सीमा φ-1.96 और φ+1.96बाएं"> होगी

छोटे नमूनों के लिए 1.96 के बजाय, एन -1 डिग्री स्वतंत्रता के लिए टी के मूल्य को प्रतिस्थापित करने की सिफारिश की जाती है। यह विधिनकारात्मक मान नहीं देता है और वाल्ड विधि की तुलना में आवृत्तियों के लिए आत्मविश्वास अंतराल के अधिक सटीक अनुमानों की अनुमति देता है। इसके अलावा, यह चिकित्सा आंकड़ों पर कई घरेलू संदर्भ पुस्तकों में वर्णित है, हालांकि, चिकित्सा अनुसंधान में इसका व्यापक उपयोग नहीं हुआ। 0 या 1 के करीब आने वाली आवृत्तियों के लिए कोण परिवर्तन का उपयोग करके आत्मविश्वास अंतराल की गणना करने की अनुशंसा नहीं की जाती है।

यह वह जगह है जहां चिकित्सा शोधकर्ताओं के लिए आंकड़ों की मूल बातें पर अधिकांश पुस्तकों में आत्मविश्वास अंतराल का अनुमान लगाने के तरीकों का वर्णन आमतौर पर समाप्त होता है, और यह समस्या न केवल घरेलू, बल्कि विदेशी साहित्य के लिए भी विशिष्ट है। दोनों विधियां केंद्रीय सीमा प्रमेय पर आधारित हैं, जिसका अर्थ है एक बड़ा नमूना।

उपरोक्त विधियों का उपयोग करके आत्मविश्वास अंतराल का अनुमान लगाने की कमियों को देखते हुए, क्लॉपर (क्लॉपर) और पियर्सन (पियर्सन) ने 1934 में अध्ययन किए गए गुण के द्विपद वितरण को ध्यान में रखते हुए तथाकथित सटीक आत्मविश्वास अंतराल की गणना के लिए एक विधि प्रस्तावित की। यह विधि कई ऑनलाइन कैलकुलेटर में उपलब्ध है, हालांकि, इस तरह से प्राप्त विश्वास अंतराल ज्यादातर मामलों में बहुत व्यापक हैं। साथ ही, उन मामलों में उपयोग के लिए इस पद्धति की सिफारिश की जाती है जहां एक रूढ़िवादी अनुमान की आवश्यकता होती है। विधि की रूढ़िवादिता की डिग्री बढ़ जाती है क्योंकि नमूना आकार घट जाता है, विशेष रूप से N . के लिए< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

कई सांख्यिकीविदों के अनुसार, आवृत्तियों के लिए आत्मविश्वास अंतराल का सबसे इष्टतम अनुमान विल्सन विधि द्वारा किया जाता है, जिसे 1927 में वापस प्रस्तावित किया गया था, लेकिन व्यावहारिक रूप से घरेलू जैव चिकित्सा अनुसंधान में इसका उपयोग नहीं किया गया था। यह विधि न केवल बहुत छोटी और बहुत उच्च आवृत्तियों दोनों के लिए आत्मविश्वास अंतराल का अनुमान लगाना संभव बनाती है, बल्कि कम संख्या में टिप्पणियों पर भी लागू होती है। पर सामान्य दृष्टि सेविल्सन फॉर्मूला के अनुसार आत्मविश्वास अंतराल का रूप है



जहां 95% विश्वास अंतराल की गणना करते समय यह मान 1.96 लेता है, N अवलोकनों की संख्या है, और p नमूने में विशेषता की आवृत्ति है। यह विधि ऑनलाइन कैलकुलेटर में उपलब्ध है, इसलिए इसका आवेदन समस्याग्रस्त नहीं है। और n p . के लिए इस पद्धति का उपयोग करने की अनुशंसा न करें< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

विल्सन विधि के अलावा, एग्रेसी-कौल-सुधारित वाल्ड पद्धति को भी आवृत्तियों के लिए विश्वास अंतराल का एक इष्टतम अनुमान प्रदान करने के लिए माना जाता है। Agresti-Coulle सुधार नमूना (p) में एक विशेषता के घटित होने की आवृत्ति के वाल्ड सूत्र में p` द्वारा प्रतिस्थापित किया जाता है, जब गणना करते समय कि कौन सा 2 अंश में जोड़ा जाता है, और 4 को हर में जोड़ा जाता है, अर्थात् , p` = (X + 2) / (N + 4), जहां X उन अध्ययन प्रतिभागियों की संख्या है जिनके पास अध्ययन के तहत विशेषता है, और N नमूना आकार है। यह संशोधन विल्सन फॉर्मूला के समान परिणाम देता है, सिवाय इसके कि जब घटना दर 0% या 100% तक पहुंच जाए और नमूना छोटा हो। आवृत्तियों के लिए विश्वास अंतराल की गणना के लिए उपरोक्त विधियों के अलावा, निरंतरता के लिए सुधार वाल्ड विधि और विल्सन विधि दोनों के लिए छोटे नमूनों के लिए प्रस्तावित किए गए हैं, लेकिन अध्ययनों से पता चला है कि उनका उपयोग अनुचित है।

दो उदाहरणों का उपयोग करते हुए विश्वास अंतराल की गणना के लिए उपरोक्त विधियों के अनुप्रयोग पर विचार करें। पहले मामले में, हम बेतरतीब ढंग से चुने गए 1,000 अध्ययन प्रतिभागियों के एक बड़े नमूने का अध्ययन कर रहे हैं, जिनमें से 450 में अध्ययन के तहत विशेषता है (यह एक जोखिम कारक, एक परिणाम या कोई अन्य लक्षण हो सकता है), जो कि 0.45 की आवृत्ति है। या 45%। दूसरे मामले में, अध्ययन एक छोटे नमूने का उपयोग करके किया जाता है, कहते हैं, केवल 20 लोग, और अध्ययन में केवल 1 प्रतिभागी (5%) के पास अध्ययन के तहत विशेषता है। वॉल्ड विधि के लिए कॉन्फिडेंस इंटरवल, एग्रेसी-कॉल करेक्शन के साथ वाल्ड मेथड के लिए, विल्सन मेथड के लिए जेफ सॉरो (//www./wald.htm) द्वारा विकसित एक ऑनलाइन कैलकुलेटर का उपयोग करके गणना की गई थी। निरंतरता-सुधारित विल्सन आत्मविश्वास अंतराल की गणना वासर स्टैट्स द्वारा प्रदान किए गए कैलकुलेटर का उपयोग करके की गई थी: सांख्यिकीय संगणना के लिए वेब साइट (//faculty.vassar.edu/lowry/prop1.html)। फिशर कोणीय परिवर्तन का उपयोग करते हुए गणना क्रमशः 19 और 999 डिग्री स्वतंत्रता के लिए टी के महत्वपूर्ण मूल्य का उपयोग करके "मैन्युअल रूप से" की गई थी। गणना के परिणाम दोनों उदाहरणों के लिए तालिका में प्रस्तुत किए गए हैं।

कॉन्फिडेंस इंटरवल की गणना छह . द्वारा की जाती है विभिन्न तरीकेपाठ में वर्णित दो उदाहरणों के लिए

कॉन्फिडेंस इंटरवल कैलकुलेशन मेथड

पी = 0.0500, या 5%

एक्स = 450, एन = 1000, पी = 0.4500, या 45% के लिए 95% सीआई

–0,0455–0,2541

Agresti-Coll सुधार के साथ वाल्डा

<,0001–0,2541

निरंतरता सुधार के साथ विल्सन

क्लॉपर-पियर्सन की "सटीक विधि"

कोणीय परिवर्तन

<0,0001–0,1967

जैसा कि तालिका से देखा जा सकता है, पहले उदाहरण के लिए, "आम तौर पर स्वीकृत" वाल्ड विधि द्वारा गणना की गई आत्मविश्वास अंतराल नकारात्मक क्षेत्र में जाती है, जो आवृत्तियों के मामले में नहीं हो सकती है। दुर्भाग्य से, रूसी साहित्य में ऐसी घटनाएं असामान्य नहीं हैं। डेटा को आवृत्ति के रूप में प्रस्तुत करने का पारंपरिक तरीका और इसकी त्रुटि आंशिक रूप से इस समस्या को छुपाती है। उदाहरण के लिए, यदि किसी विशेषता की घटना की आवृत्ति (प्रतिशत में) 2.1 ± 1.4 के रूप में प्रस्तुत की जाती है, तो यह 2.1% (95% सीआई: -0.7; 4.9) के रूप में "परेशान" नहीं है, हालांकि और इसका मतलब वही है। Agresti-Coll सुधार के साथ वाल्ड विधि और कोणीय परिवर्तन का उपयोग करके गणना शून्य को कम बाध्य प्रवृत्ति देती है। निरंतरता सुधार के साथ विल्सन विधि और "सटीक विधि" विल्सन विधि की तुलना में व्यापक आत्मविश्वास अंतराल देती है। दूसरे उदाहरण के लिए, सभी विधियाँ लगभग समान आत्मविश्वास अंतराल देती हैं (अंतर केवल हज़ारवें हिस्से में दिखाई देते हैं), जो आश्चर्य की बात नहीं है, क्योंकि इस उदाहरण में घटना की आवृत्ति 50% से बहुत भिन्न नहीं है, और नमूना आकार काफी बड़ा है .

इस समस्या में रुचि रखने वाले पाठकों के लिए, हम आर जी न्यूकॉम्ब और ब्राउन, कै और दासगुप्ता के कार्यों की सिफारिश कर सकते हैं, जो क्रमशः आत्मविश्वास अंतराल की गणना के लिए 7 और 10 विभिन्न तरीकों का उपयोग करने के पेशेवरों और विपक्षों को देते हैं। घरेलू मैनुअल से, पुस्तक और की सिफारिश की जाती है, जिसमें सिद्धांत के विस्तृत विवरण के अलावा, वाल्ड, विल्सन के तरीकों के साथ-साथ द्विपद आवृत्ति वितरण को ध्यान में रखते हुए आत्मविश्वास अंतराल की गणना करने की एक विधि प्रस्तुत की जाती है। . मुफ्त ऑनलाइन कैलकुलेटर (http://www./wald.htm और http://faculty.vassar.edu/lowry/prop1.html) के अलावा, आवृत्तियों के लिए आत्मविश्वास अंतराल (और न केवल!) का उपयोग करके गणना की जा सकती है सीआईए प्रोग्राम (कॉन्फिडेंस इंटरवल एनालिसिस), जिसे http://www से डाउनलोड किया जा सकता है। माध्यमिक विद्यालय। सोटन एसी। यूके/सिया/.

अगला लेख गुणात्मक डेटा की तुलना करने के अविभाज्य तरीकों पर विचार करेगा।

ग्रन्थसूची

बनर्जी ए.सादे भाषा में चिकित्सा सांख्यिकी: एक परिचयात्मक पाठ्यक्रम / ए. बनरज़ी। - एम।: प्रैक्टिकल मेडिसिन, 2007. - 287 पी। चिकित्सा सांख्यिकी /। - एम।: चिकित्सा सूचना एजेंसी, 2007. - 475 पी। ग्लैंज़ एस.मेडिको-बायोलॉजिकल स्टैटिस्टिक्स / एस। ग्लांट्स। - एम।: अभ्यास, 1998। डेटा प्रकार, वितरण सत्यापन और वर्णनात्मक आँकड़े // मानव पारिस्थितिकी - 2008। - संख्या 1. - पी। 52-58। झिझिन के.एस.. चिकित्सा सांख्यिकी: पाठ्यपुस्तक / . - रोस्तोव एन / डी: फीनिक्स, 2007. - 160 पी। अनुप्रयुक्त चिकित्सा सांख्यिकी / , . - सेंट पीटर्सबर्ग। : फोलियो, 2003. - 428 पी। लैकिन जी. एफ. बायोमेट्रिक्स /। - एम।: हायर स्कूल, 1990। - 350 पी। चिकित्सा वी. ए. चिकित्सा में गणितीय सांख्यिकी / , . - एम।: वित्त और सांख्यिकी, 2007. - 798 पी। नैदानिक ​​अनुसंधान में गणितीय सांख्यिकी / . - एम।: जियोटार-मेड, 2001. - 256 पी। जंकरोव वी. और. चिकित्सा अनुसंधान डेटा का मेडिको-सांख्यिकीय प्रसंस्करण /। - सेंट पीटर्सबर्ग। : वीमेडए, 2002. - 266 पी। अग्रेस्टी ए.द्विपद अनुपात के अंतराल अनुमान के लिए अनुमानित सटीक से बेहतर है / ए। अग्रेस्टी, बी। कौल // अमेरिकी सांख्यिकीविद्। - 1998. - एन 52. - एस। 119-126। ऑल्टमैन डी.विश्वास के साथ सांख्यिकी // डी। ऑल्टमैन, डी। माचिन, टी। ब्रायंट, एमजे गार्डनर। - लंदन: बीएमजे बुक्स, 2000. - 240 पी। ब्राउन एल.डी.द्विपद अनुपात के लिए अंतराल अनुमान / एल डी ब्राउन, टी टी कै, ए दासगुप्ता // सांख्यिकीय विज्ञान। - 2001. - एन 2. - पी। 101-133। क्लॉपर सी.जे.द्विपद/सी.जे. क्लॉपर, ई.एस. पियर्सन // बायोमेट्रिका के मामले में सचित्र विश्वास या प्रत्ययी सीमाओं का उपयोग। - 1934. - एन 26. - पी। 404-413। गार्सिया-पेरेज़ एम. ए. द्विपद पैरामीटर के लिए विश्वास अंतराल पर / एम ए गार्सिया-पेरेज़ // गुणवत्ता और मात्रा। - 2005. - एन 39. - पी। 467-481। मोटुल्स्की एच.सहज बायोस्टैटिस्टिक्स // एच। मोटुल्स्की। - ऑक्सफोर्ड: ऑक्सफोर्ड यूनिवर्सिटी प्रेस, 1995. - 386 पी। न्यूकॉम्ब आर.जी.एकल अनुपात के लिए दो तरफा विश्वास अंतराल: सात विधियों की तुलना / आर जी न्यूकॉम्ब // चिकित्सा में सांख्यिकी। - 1998. - एन। 17. - पी। 857-872। सौरो जे.द्विपद विश्वास अंतराल का उपयोग करते हुए छोटे नमूनों से पूर्णता दर का अनुमान लगाना: तुलना और सिफारिशें / जे। सौरो, जे। आर। लुईस // मानव कारकों और एर्गोनॉमिक्स सोसायटी की वार्षिक बैठक की कार्यवाही। - ऑरलैंडो, FL, 2005। वाल्ड ए.निरंतर वितरण कार्यों के लिए कॉन्फिडेंस लिमिट्स // ए। वाल्ड, जे। वोल्फोविट्ज // एनल्स ऑफ मैथमैटिकल स्टैटिस्टिक्स। - 1939. - एन 10. - पी। 105-118। विल्सन ई. बी. संभावित अनुमान, उत्तराधिकार का नियम, और सांख्यिकीय अनुमान / ई.बी. विल्सन // जर्नल ऑफ़ अमेरिकन स्टैटिस्टिकल एसोसिएशन। - 1927. - एन 22. - पी। 209-212।

अनुपात के लिए विश्वास अंतराल

ए। एम. ग्रजिबोव्स्की

सार्वजनिक स्वास्थ्य के राष्ट्रीय संस्थान, ओस्लो, नॉर्वे

लेख द्विपद अनुपातों के लिए विश्वास अंतराल की गणना के लिए कई तरीके प्रस्तुत करता है, अर्थात्, वाल्ड, विल्सन, आर्क्सिन, एग्रेसी-कूल और सटीक क्लॉपर-पियर्सन विधियां। पेपर एक द्विपद अनुपात के विश्वास अंतराल अनुमान की समस्या का केवल सामान्य परिचय देता है और इसका उद्देश्य न केवल पाठकों को अपने अनुभवजन्य शोध के परिणाम प्रस्तुत करते समय आत्मविश्वास अंतराल का उपयोग करने के लिए प्रोत्साहित करना है, बल्कि उन्हें पहले सांख्यिकी पुस्तकों से परामर्श करने के लिए प्रोत्साहित करना है। स्वयं के डेटा का विश्लेषण और पांडुलिपियां तैयार करना।

मुख्य शब्द: विश्वास अंतराल, अनुपात

संपर्क जानकारी:

वरिष्ठ सलाहकार, राष्ट्रीय जन स्वास्थ्य संस्थान, ओस्लो, नॉर्वे

और अन्य। वे सभी अपने सैद्धांतिक समकक्षों के अनुमान हैं, जो एक नमूना नहीं, बल्कि सामान्य आबादी होने पर प्राप्त किया जा सकता है। लेकिन अफसोस, आम जनता बहुत महंगी है और अक्सर अनुपलब्ध रहती है।

अंतराल अनुमान की अवधारणा

किसी भी नमूना अनुमान में कुछ बिखराव होता है, क्योंकि एक विशेष नमूने में मूल्यों के आधार पर एक यादृच्छिक चर है। इसलिए, अधिक विश्वसनीय सांख्यिकीय अनुमानों के लिए, किसी को न केवल बिंदु अनुमान, बल्कि अंतराल भी जानना चाहिए, जिसकी उच्च संभावना है γ (गामा) अनुमानित संकेतक को कवर करता है θ (थीटा)।

औपचारिक रूप से, ये दो ऐसे मान (आँकड़े) हैं टी 1 (एक्स)तथा टी 2 (एक्स), क्या टी1< T 2 , जिसके लिए संभाव्यता के एक निश्चित स्तर पर γ शर्त पूरी होती है:

संक्षेप में, यह संभावना है γ या अधिक सही मान बिंदुओं के बीच है टी 1 (एक्स)तथा टी 2 (एक्स), जिन्हें निचली और ऊपरी सीमा कहा जाता है विश्वास अंतराल.

आत्मविश्वास अंतराल के निर्माण की शर्तों में से एक इसकी अधिकतम संकीर्णता है, अर्थात। यह यथासंभव छोटा होना चाहिए। इच्छा बिलकुल स्वाभाविक है, क्योंकि। शोधकर्ता वांछित पैरामीटर की खोज को अधिक सटीक रूप से स्थानीयकृत करने का प्रयास करता है।

यह इस प्रकार है कि विश्वास अंतराल को वितरण की अधिकतम संभावनाओं को कवर करना चाहिए। और मूल्यांकन ही केंद्र में हो।

यानी ऊपर की ओर विचलन (अनुमान से सही संकेतक की) की संभावना नीचे की ओर विचलन की संभावना के बराबर है। यह भी ध्यान दिया जाना चाहिए कि विषम वितरण के लिए, दाईं ओर का अंतराल बाईं ओर के अंतराल के बराबर नहीं है।

ऊपर दिया गया आंकड़ा स्पष्ट रूप से दिखाता है कि आत्मविश्वास का स्तर जितना अधिक होगा, अंतराल उतना ही व्यापक होगा - एक सीधा संबंध।

यह अज्ञात मापदंडों के अंतराल आकलन के सिद्धांत का एक छोटा सा परिचय था। आइए गणितीय अपेक्षा के लिए आत्मविश्वास की सीमा खोजने के लिए आगे बढ़ें।

गणितीय अपेक्षा के लिए विश्वास अंतराल

यदि मूल डेटा को वितरित किया जाता है, तो औसत सामान्य मान होगा। यह इस नियम से चलता है कि सामान्य मूल्यों के रैखिक संयोजन का भी सामान्य वितरण होता है। इसलिए, संभावनाओं की गणना करने के लिए, हम सामान्य वितरण कानून के गणितीय तंत्र का उपयोग कर सकते हैं।

हालांकि, इसके लिए दो मापदंडों के ज्ञान की आवश्यकता होगी - अपेक्षित मूल्य और विचरण, जो आमतौर पर ज्ञात नहीं होते हैं। बेशक, आप मापदंडों (अंकगणित माध्य और) के बजाय अनुमानों का उपयोग कर सकते हैं, लेकिन तब माध्य का वितरण बिल्कुल सामान्य नहीं होगा, यह थोड़ा चपटा हो जाएगा। आयरलैंड के नागरिक विलियम गॉसेट ने इस तथ्य को बखूबी नोट किया जब उन्होंने बायोमेट्रिका के मार्च 1908 के अंक में अपनी खोज प्रकाशित की। गोपनीयता के उद्देश्य से, गॉसेट ने छात्र के साथ हस्ताक्षर किए। इस प्रकार विद्यार्थी का t-वितरण प्रकट हुआ।

हालांकि, खगोलीय प्रेक्षणों में त्रुटियों के विश्लेषण में के. गॉस द्वारा उपयोग किए गए डेटा का सामान्य वितरण, स्थलीय जीवन में अत्यंत दुर्लभ है और इसे स्थापित करना काफी कठिन है (उच्च सटीकता के लिए लगभग 2 हजार अवलोकनों की आवश्यकता होती है)। इसलिए, सामान्यता की धारणा को छोड़ना और उन तरीकों का उपयोग करना सबसे अच्छा है जो मूल डेटा के वितरण पर निर्भर नहीं करते हैं।

प्रश्न उठता है: यदि किसी अज्ञात वितरण के डेटा से गणना की जाए तो अंकगणितीय माध्य का वितरण क्या है? उत्तर सुप्रसिद्ध प्रायिकता सिद्धांत द्वारा दिया गया है केंद्रीय सीमा प्रमेय(सीपीटी)। गणित में, इसके कई संस्करण हैं (वर्षों में सूत्रों को परिष्कृत किया गया है), लेकिन उनमें से सभी मोटे तौर पर इस कथन पर आते हैं कि बड़ी संख्या में स्वतंत्र यादृच्छिक चर का योग सामान्य वितरण कानून का पालन करता है।

अंकगणित माध्य की गणना करते समय, यादृच्छिक चर के योग का उपयोग किया जाता है। इससे यह पता चलता है कि अंकगणितीय माध्य का एक सामान्य वितरण होता है, जिसमें अपेक्षित मूल्य प्रारंभिक डेटा का अपेक्षित मूल्य होता है, और विचरण होता है।

स्मार्ट लोग जानते हैं कि सीएलटी को कैसे साबित करना है, लेकिन हम इसे एक्सेल में किए गए एक प्रयोग की मदद से सत्यापित करेंगे। आइए 50 समान रूप से वितरित यादृच्छिक चर (एक्सेल फ़ंक्शन RANDOMBETWEEN का उपयोग करके) का एक नमूना अनुकरण करें। फिर हम ऐसे 1000 नमूने बनाएंगे और प्रत्येक के लिए अंकगणितीय माध्य की गणना करेंगे। आइए उनके वितरण को देखें।

यह देखा जा सकता है कि औसत का वितरण सामान्य कानून के करीब है। यदि नमूनों की मात्रा और उनकी संख्या को और भी बड़ा कर दिया जाए, तो समानता और भी बेहतर हो जाएगी।

अब जब हमने अपने लिए सीएलटी की वैधता देख ली है, तो हम अंकगणितीय माध्य के लिए विश्वास अंतराल की गणना कर सकते हैं, जो किसी दिए गए संभाव्यता के साथ सही माध्य या गणितीय अपेक्षा को कवर करता है।

ऊपरी और निचली सीमाओं को स्थापित करने के लिए, सामान्य वितरण के मापदंडों को जानना आवश्यक है। एक नियम के रूप में, वे नहीं हैं, इसलिए अनुमानों का उपयोग किया जाता है: अंकगणित औसततथा नमूना विचरण. फिर से, यह विधि केवल बड़े नमूनों के लिए एक अच्छा सन्निकटन देती है। जब नमूने छोटे होते हैं, तो अक्सर छात्र के वितरण का उपयोग करने की सिफारिश की जाती है। विश्वास मत करो! माध्य के लिए विद्यार्थी का वितरण तभी होता है जब मूल डेटा का सामान्य वितरण होता है, यानी लगभग कभी नहीं। इसलिए, आवश्यक डेटा की मात्रा के लिए न्यूनतम बार तुरंत सेट करना और विषम रूप से सही तरीकों का उपयोग करना बेहतर है। वे कहते हैं कि 30 अवलोकन पर्याप्त हैं। 50 लो - तुम गलत नहीं हो सकते।

टी 1.2विश्वास अंतराल की निचली और ऊपरी सीमाएँ हैं

- नमूना अंकगणित माध्य

एस0- नमूना मानक विचलन (निष्पक्ष)

एन - नमूने का आकार

γ - आत्मविश्वास का स्तर (आमतौर पर 0.9, 0.95 या 0.99) के बराबर

सी γ =Φ -1 ((1+γ)/2)मानक सामान्य वितरण फ़ंक्शन का पारस्परिक है। सरल शब्दों में, यह अंकगणित माध्य से निचली या ऊपरी सीमा तक मानक त्रुटियों की संख्या है (संकेतित तीन संभावनाएं 1.64, 1.96 और 2.58 के मानों के अनुरूप हैं)।

सूत्र का सार यह है कि अंकगणित माध्य लिया जाता है और फिर उसमें से एक निश्चित राशि अलग कर दी जाती है ( . के साथ) मानक त्रुटियां ( एस 0 /√n) सब कुछ ज्ञात है, इसे लो और गिनें।

पीसी के बड़े पैमाने पर उपयोग से पहले, सामान्य वितरण फ़ंक्शन और इसके व्युत्क्रम के मूल्यों को प्राप्त करने के लिए, उन्होंने . वे अभी भी उपयोग किए जाते हैं, लेकिन तैयार एक्सेल फ़ार्मुलों की ओर मुड़ना अधिक कुशल है। उपरोक्त सूत्र ( , और ) के सभी तत्वों की गणना एक्सेल में आसानी से की जा सकती है। लेकिन कॉन्फिडेंस इंटरवल की गणना के लिए एक रेडीमेड फॉर्मूला भी है - विश्वास मानदंड. इसका सिंटैक्स निम्न है।

विश्वास मानदंड (अल्फा, मानक_देव, आकार)

अल्फा- महत्व स्तर या आत्मविश्वास का स्तर, जो उपरोक्त संकेतन में 1-γ के बराबर है, अर्थात। संभावना है कि गणितीयउम्मीद विश्वास अंतराल के बाहर होगी। 0.95 के आत्मविश्वास स्तर के साथ, अल्फा 0.05 है, और इसी तरह।

मानक_ऑफनमूना डेटा का मानक विचलन है। आपको मानक त्रुटि की गणना करने की आवश्यकता नहीं है, एक्सेल n की जड़ से विभाजित होगा।

आकार- नमूना आकार (एन)।

CONFIDENCE.NORM फ़ंक्शन का परिणाम विश्वास अंतराल की गणना के लिए सूत्र से दूसरा शब्द है, अर्थात। आधा अंतराल। तदनुसार, निचले और ऊपरी बिंदु औसत ± प्राप्त मूल्य हैं।

इस प्रकार, अंकगणित माध्य के लिए विश्वास अंतराल की गणना के लिए एक सार्वभौमिक एल्गोरिथ्म बनाना संभव है, जो प्रारंभिक डेटा के वितरण पर निर्भर नहीं करता है। सार्वभौमिकता की कीमत इसकी स्पर्शोन्मुख प्रकृति है, अर्थात। अपेक्षाकृत बड़े नमूनों का उपयोग करने की आवश्यकता। हालांकि, आधुनिक तकनीक के युग में, सही मात्रा में डेटा एकत्र करना आमतौर पर मुश्किल नहीं होता है।

एक विश्वास अंतराल का उपयोग करके सांख्यिकीय परिकल्पना का परीक्षण करना

(मॉड्यूल 111)

सांख्यिकी में हल की जाने वाली मुख्य समस्याओं में से एक है। संक्षेप में इसका सार यही है। उदाहरण के लिए, एक धारणा बनाई जाती है कि सामान्य जनसंख्या की अपेक्षा कुछ मूल्य के बराबर होती है। फिर नमूना साधनों के वितरण का निर्माण किया जाता है, जिसे एक निश्चित अपेक्षा के साथ देखा जा सकता है। इसके बाद, हम देखते हैं कि इस सशर्त वितरण में वास्तविक औसत कहाँ स्थित है। यदि यह स्वीकार्य सीमा से अधिक हो जाता है, तो इस तरह के औसत की उपस्थिति बहुत ही असंभव है, और प्रयोग की एक पुनरावृत्ति के साथ यह लगभग असंभव है, जो कि परिकल्पना के विपरीत है, जिसे सफलतापूर्वक खारिज कर दिया गया है। यदि औसत महत्वपूर्ण स्तर से आगे नहीं जाता है, तो परिकल्पना को खारिज नहीं किया जाता है (लेकिन यह भी साबित नहीं होता है!)

तो, विश्वास अंतराल की सहायता से, हमारे मामले में अपेक्षा के लिए, आप कुछ परिकल्पनाओं का परीक्षण भी कर सकते हैं। यह करना बहुत आसान है। मान लीजिए कि किसी नमूने के लिए अंकगणितीय माध्य 100 है। परिकल्पना का परीक्षण किया जा रहा है कि अपेक्षा, मान लीजिए, 90 है। यानी, यदि हम प्रश्न को मूल रूप से रखते हैं, तो ऐसा लगता है: क्या ऐसा हो सकता है कि औसत के सही मूल्य के साथ 90 के बराबर, देखा गया कि औसत 100 निकला?

इस प्रश्न का उत्तर देने के लिए, मानक विचलन और नमूना आकार पर अतिरिक्त जानकारी की आवश्यकता होगी। मान लें कि मानक विचलन 30 है, और अवलोकनों की संख्या 64 है (मूल को आसानी से निकालने के लिए)। तब माध्य की मानक त्रुटि 30/8 या 3.75 है। 95% विश्वास अंतराल की गणना करने के लिए, आपको माध्य के दोनों किनारों पर दो मानक त्रुटियों को अलग रखना होगा (अधिक सटीक रूप से, 1.96)। विश्वास अंतराल लगभग 100 ± 7.5, या 92.5 से 107.5 तक होगा।

आगे तर्क इस प्रकार है। यदि परीक्षण किया गया मान विश्वास अंतराल के भीतर आता है, तो यह परिकल्पना का खंडन नहीं करता है, क्योंकि यादृच्छिक उतार-चढ़ाव की सीमा के भीतर फिट बैठता है (95% की संभावना के साथ)। यदि परीक्षण बिंदु विश्वास अंतराल के बाहर है, तो ऐसी घटना की संभावना बहुत कम है, किसी भी मामले में स्वीकार्य स्तर से नीचे। अतः परिकल्पना को प्रेक्षित आँकड़ों के विपरीत बताते हुए अस्वीकृत किया जाता है। हमारे मामले में, उम्मीद की परिकल्पना विश्वास अंतराल के बाहर है (90 का परीक्षण मूल्य 100 ± 7.5 के अंतराल में शामिल नहीं है), इसलिए इसे अस्वीकार कर दिया जाना चाहिए। उपरोक्त आदिम प्रश्न का उत्तर देते हुए, किसी को कहना चाहिए: नहीं, यह किसी भी स्थिति में नहीं हो सकता है, ऐसा बहुत कम होता है। अक्सर, यह परिकल्पना (पी-स्तर) की गलत अस्वीकृति की एक विशिष्ट संभावना को इंगित करता है, न कि किसी दिए गए स्तर के अनुसार, जिसके अनुसार आत्मविश्वास अंतराल बनाया गया था, लेकिन उस पर एक और समय।

जैसा कि आप देख सकते हैं, माध्य (या गणितीय अपेक्षा) के लिए एक विश्वास अंतराल बनाना मुश्किल नहीं है। मुख्य बात सार को पकड़ना है, और फिर चीजें चली जाएंगी। व्यवहार में, अधिकांश 95% विश्वास अंतराल का उपयोग करते हैं, जो कि माध्य के दोनों ओर लगभग दो मानक त्रुटियां हैं।

अभी के लिए इतना ही। शुभकामनाएं!

सांख्यिकीय समस्याओं को हल करने के तरीकों में से एक विश्वास अंतराल की गणना है। नमूना आकार छोटा होने पर इसका उपयोग बिंदु अनुमान के पसंदीदा विकल्प के रूप में किया जाता है। यह ध्यान दिया जाना चाहिए कि विश्वास अंतराल की गणना करने की प्रक्रिया बल्कि जटिल है। लेकिन एक्सेल प्रोग्राम के टूल्स आपको इसे कुछ हद तक सरल बनाने की अनुमति देते हैं। आइए जानें कि यह व्यवहार में कैसे किया जाता है।

इस पद्धति का उपयोग विभिन्न सांख्यिकीय मात्राओं के अंतराल अनुमान में किया जाता है। इस गणना का मुख्य कार्य बिंदु अनुमान की अनिश्चितताओं से छुटकारा पाना है।

एक्सेल में, इस पद्धति का उपयोग करके गणना करने के लिए दो मुख्य विकल्प हैं: जब विचरण ज्ञात हो, और जब यह अज्ञात हो। पहले मामले में, फ़ंक्शन का उपयोग गणना के लिए किया जाता है विश्वास मानदंड, और दूसरे में ट्रस्ट.विद्यार्थी.

विधि 1: कॉन्फिडेंस नॉर्म फंक्शन

ऑपरेटर विश्वास मानदंड, जो कार्यों के सांख्यिकीय समूह को संदर्भित करता है, पहली बार एक्सेल 2010 में दिखाई दिया। इस कार्यक्रम के पुराने संस्करण इसके समकक्ष का उपयोग करते हैं विश्वास. इस ऑपरेटर का कार्य जनसंख्या माध्य के सामान्य वितरण के साथ एक विश्वास अंतराल की गणना करना है।

इसका सिंटैक्स इस प्रकार है:

विश्वास मानदंड (अल्फा, मानक_देव, आकार)

"अल्फा"एक तर्क है जो महत्व के स्तर को दर्शाता है जिसका उपयोग आत्मविश्वास के स्तर की गणना के लिए किया जाता है। आत्मविश्वास का स्तर निम्न अभिव्यक्ति के बराबर है:

(1- "अल्फा")*100

"मानक विचलन"एक तर्क है, जिसका सार नाम से स्पष्ट है। यह प्रस्तावित नमूने का मानक विचलन है।

"आकार"एक तर्क है जो नमूने के आकार को निर्धारित करता है।

इस ऑपरेटर के लिए सभी तर्क आवश्यक हैं।

समारोह विश्वासपिछले वाले के समान ही तर्क और संभावनाएं हैं। इसका सिंटैक्स है:

ट्रस्ट (अल्फा, मानक_देव, आकार)

जैसा कि आप देख सकते हैं, अंतर केवल ऑपरेटर के नाम पर हैं। संगतता कारणों से इस सुविधा को Excel 2010 और नए संस्करणों में एक विशेष श्रेणी में रखा गया है। "संगतता". एक्सेल 2007 और इससे पहले के संस्करणों में, यह सांख्यिकीय ऑपरेटरों के मुख्य समूह में मौजूद है।

विश्वास अंतराल की सीमा निम्नलिखित फॉर्म के सूत्र का उपयोग करके निर्धारित की जाती है:

एक्स+(-)विश्वास मानदंड

कहाँ पे एक्सनमूना माध्य है, जो चयनित श्रेणी के मध्य में स्थित है।

अब आइए देखें कि एक विशिष्ट उदाहरण का उपयोग करके विश्वास अंतराल की गणना कैसे करें। 12 परीक्षण किए गए, जिसके परिणामस्वरूप विभिन्न परिणाम सामने आए, जो तालिका में सूचीबद्ध हैं। यह हमारी समग्रता है। मानक विचलन 8 है। हमें 97% विश्वास स्तर पर विश्वास अंतराल की गणना करने की आवश्यकता है।

  1. उस सेल का चयन करें जहां डेटा प्रोसेसिंग का परिणाम प्रदर्शित किया जाएगा। बटन पर क्लिक करना "फ़ंक्शन डालें".
  2. दिखाई पड़ना फंक्शन विजार्ड. श्रेणी पर जाएँ "सांख्यिकीय"और नाम हाइलाइट करें "CONFIDENCE.NORM". इसके बाद बटन पर क्लिक करें ठीक है.
  3. तर्क विंडो खुलती है। इसके क्षेत्र स्वाभाविक रूप से तर्कों के नामों से मेल खाते हैं।
    कर्सर को पहले फील्ड पर सेट करें - "अल्फा". यहां हमें महत्व के स्तर को निर्दिष्ट करना चाहिए। जैसा कि हमें याद है, हमारे भरोसे का स्तर 97% है। उसी समय, हमने कहा कि इसकी गणना इस तरह से की जाती है:

    (1-विश्वास स्तर)/100

    अर्थात्, मान को प्रतिस्थापित करने पर, हम प्राप्त करते हैं:

    सरल गणनाओं से, हम पाते हैं कि तर्क "अल्फा"बराबरी 0,03 . इस मान को फ़ील्ड में दर्ज करें।

    जैसा कि आप जानते हैं, मानक विचलन बराबर होता है 8 . इसलिए, क्षेत्र में "मानक विचलन"बस उस नंबर को लिख लें।

    खेत मेँ "आकार"आपको किए गए परीक्षणों के तत्वों की संख्या दर्ज करने की आवश्यकता है। जैसा कि हम याद करते हैं, वे 12 . लेकिन सूत्र को स्वचालित करने के लिए और हर बार एक नया परीक्षण किए जाने पर इसे संपादित नहीं करने के लिए, आइए इस मान को एक साधारण संख्या पर नहीं, बल्कि ऑपरेटर का उपयोग करके सेट करें जांच. इसलिए, हम कर्सर को फ़ील्ड में सेट करते हैं "आकार", और फिर त्रिभुज पर क्लिक करें, जो सूत्र पट्टी के बाईं ओर स्थित है।

    हाल ही में उपयोग किए गए कार्यों की एक सूची दिखाई देती है। यदि ऑपरेटर जांचआपके द्वारा हाल ही में उपयोग किया गया, यह इस सूची में होना चाहिए। ऐसे में आपको बस इसके नाम पर क्लिक करना है। नहीं तो नहीं मिले तो बात पर जाइए "अधिक सुविधाएं...".

  4. हमें पहले से ही परिचित प्रतीत होता है फंक्शन विजार्ड. समूह में वापस जाना "सांख्यिकीय". हम वहां नाम का चयन करते हैं "जांच". बटन पर क्लिक करें ठीक है.
  5. उपरोक्त ऑपरेटर के लिए तर्क विंडो प्रकट होती है। यह फ़ंक्शन निर्दिष्ट श्रेणी में उन कक्षों की संख्या की गणना करने के लिए डिज़ाइन किया गया है जिनमें संख्यात्मक मान होते हैं। इसका सिंटैक्स निम्नलिखित है:

    COUNT(मान1, मान2,…)

    तर्क समूह "मूल्य"उस श्रेणी का संदर्भ है जिसमें आप संख्यात्मक डेटा से भरे हुए कक्षों की संख्या की गणना करना चाहते हैं। कुल मिलाकर, ऐसे 255 तर्क हो सकते हैं, लेकिन हमारे मामले में हमें केवल एक की आवश्यकता है।

    कर्सर को फ़ील्ड में सेट करें "मान 1"और, बाईं माउस बटन को दबाए रखते हुए, उस शीट पर श्रेणी का चयन करें जिसमें हमारी जनसंख्या शामिल है। फिर उसका पता फील्ड में प्रदर्शित होगा। बटन पर क्लिक करें ठीक है.

  6. उसके बाद, एप्लिकेशन गणना करेगा और परिणाम को उस सेल में प्रदर्शित करेगा जहां वह स्वयं है। हमारे विशेष मामले में, सूत्र इस तरह निकला:

    विश्वास मानदंड(0.03,8,काउंट(बी2:बी13))

    गणना का समग्र परिणाम था 5,011609 .

  7. लेकिन वह सब नहीं है। जैसा कि हमें याद है, विश्वास अंतराल की सीमा की गणना गणना परिणाम के औसत नमूना मूल्य से जोड़कर और घटाकर की जाती है विश्वास मानदंड. इस तरह, कॉन्फिडेंस इंटरवल के दाएं और बाएं सीमाओं की गणना क्रमशः की जाती है। नमूना माध्य की गणना स्वयं ऑपरेटर का उपयोग करके की जा सकती है औसत.

    यह ऑपरेटर संख्याओं की चयनित श्रेणी के अंकगणितीय माध्य की गणना करने के लिए डिज़ाइन किया गया है। इसमें निम्नलिखित बल्कि सरल वाक्यविन्यास है:

    औसत (नंबर 1, नंबर 2,…)

    बहस "संख्या"या तो एक अंकीय मान हो सकता है या कोशिकाओं का संदर्भ हो सकता है या यहां तक ​​​​कि संपूर्ण श्रेणियां भी हो सकती हैं जिनमें वे शामिल हैं।

    तो, उस सेल का चयन करें जिसमें औसत मूल्य की गणना प्रदर्शित की जाएगी, और बटन पर क्लिक करें "फ़ंक्शन डालें".

  8. खुलती फंक्शन विजार्ड. श्रेणी पर वापस जाएं "सांख्यिकीय"और सूची से एक नाम चुनें "औसत". हमेशा की तरह, बटन पर क्लिक करें ठीक है.
  9. तर्क विंडो लॉन्च की गई है। कर्सर को फ़ील्ड में सेट करें "संख्या 1"और बाईं माउस बटन दबाकर, मानों की संपूर्ण श्रेणी का चयन करें। फ़ील्ड में निर्देशांक प्रदर्शित होने के बाद, बटन पर क्लिक करें ठीक है.
  10. फिर औसतगणना के परिणाम को शीट तत्व में आउटपुट करता है।
  11. हम कॉन्फिडेंस इंटरवल की सही सीमा की गणना करते हैं। ऐसा करने के लिए, एक अलग सेल का चयन करें, साइन इन करें «=» और शीट तत्वों की सामग्री जोड़ें जिसमें कार्यों की गणना के परिणाम स्थित हैं औसततथा विश्वास मानदंड. गणना करने के लिए, बटन दबाएं प्रवेश करना. हमारे मामले में, हमें निम्नलिखित सूत्र मिला:

    गणना परिणाम: 6,953276

  12. उसी तरह, हम विश्वास अंतराल की बाईं सीमा की गणना करते हैं, केवल इस बार गणना के परिणाम से औसतऑपरेटर की गणना के परिणाम घटाएं विश्वास मानदंड. यह निम्न प्रकार के हमारे उदाहरण के लिए सूत्र निकलता है:

    गणना परिणाम: -3,06994

  13. हमने विश्वास अंतराल की गणना के लिए सभी चरणों का विस्तार से वर्णन करने का प्रयास किया, इसलिए हमने प्रत्येक सूत्र का विस्तार से वर्णन किया। लेकिन आप सभी क्रियाओं को एक सूत्र में जोड़ सकते हैं। कॉन्फिडेंस इंटरवल की राइट बाउंड की गणना निम्नानुसार लिखी जा सकती है:

    औसत(बी2:बी13)+विश्वास(0.03,8,काउंट(बी2:बी13))

  14. बाईं सीमा की एक समान गणना इस तरह दिखेगी:

    औसत(बी2:बी13)-CONFIDENCE.NORM(0.03,8,काउंट(बी2:बी13))

विधि 2: TRUST.STUDENT फ़ंक्शन

इसके अलावा, एक्सेल में एक और फ़ंक्शन है जो कॉन्फिडेंस इंटरवल की गणना से संबंधित है - ट्रस्ट.विद्यार्थी. यह केवल एक्सेल 2010 के बाद से दिखाई दिया है। यह ऑपरेटर छात्र के वितरण का उपयोग करके जनसंख्या विश्वास अंतराल की गणना करता है। उस स्थिति में इसका उपयोग करना बहुत सुविधाजनक है जब विचरण और, तदनुसार, मानक विचलन अज्ञात हैं। ऑपरेटर सिंटैक्स है:

ट्रस्ट। छात्र (अल्फा, मानक_देव, आकार)

जैसा कि आप देख सकते हैं, इस मामले में ऑपरेटरों के नाम अपरिवर्तित रहे।

आइए देखें कि उसी आबादी के उदाहरण का उपयोग करके अज्ञात मानक विचलन के साथ विश्वास अंतराल की सीमाओं की गणना कैसे करें जिसे हमने पिछली पद्धति में माना था। पिछली बार की तरह आत्मविश्वास का स्तर हम 97 फीसदी लेंगे।

  1. उस सेल का चयन करें जिसमें गणना की जाएगी। बटन पर क्लिक करें "फ़ंक्शन डालें".
  2. खुले में फंक्शन विजार्डश्रेणी में जाएं "सांख्यिकीय". एक नाम चुनो "ट्रस्ट.स्टूडेंट". बटन पर क्लिक करें ठीक है.
  3. निर्दिष्ट ऑपरेटर के लिए तर्क विंडो लॉन्च की गई है।

    खेत मेँ "अल्फा", यह देखते हुए कि आत्मविश्वास का स्तर 97% है, हम संख्या लिखते हैं 0,03 . दूसरी बार हम इस पैरामीटर की गणना के सिद्धांतों पर ध्यान नहीं देंगे।

    उसके बाद, कर्सर को फ़ील्ड में सेट करें "मानक विचलन". इस बार, यह सूचक हमारे लिए अज्ञात है और इसकी गणना करने की आवश्यकता है। यह एक विशेष फ़ंक्शन का उपयोग करके किया जाता है - एसटीडीईवी.बी. इस ऑपरेटर की विंडो को कॉल करने के लिए, फॉर्मूला बार के बाईं ओर त्रिकोण पर क्लिक करें। यदि हमें खुलने वाली सूची में वांछित नाम नहीं मिलता है, तो आइटम पर जाएं "अधिक सुविधाएं...".

  4. दौड रहा है फंक्शन विजार्ड. श्रेणी में जाना "सांख्यिकीय"और नाम अंकित करें "एसटीडीईवी.बी". फिर बटन पर क्लिक करें ठीक है.
  5. तर्क विंडो खुलती है। ऑपरेटर कार्य एसटीडीईवी.बीनमूनाकरण में मानक विचलन की परिभाषा है। इसका सिंटैक्स इस तरह दिखता है:

    एसटीडीईवी.वी(नंबर1,नंबर2,…)

    यह अनुमान लगाना आसान है कि तर्क "संख्या"चयन तत्व का पता है। यदि चयन एक ही सरणी में रखा गया है, तो केवल एक तर्क का उपयोग करके, आप इस श्रेणी के लिए एक लिंक दे सकते हैं।

    कर्सर को फ़ील्ड में सेट करें "संख्या 1"और, हमेशा की तरह, बाएँ माउस बटन को दबाए रखते हुए, सेट का चयन करें। निर्देशांक क्षेत्र में होने के बाद, बटन दबाने में जल्दबाजी न करें ठीक हैक्योंकि परिणाम गलत होगा। सबसे पहले हमें ऑपरेटर तर्क विंडो पर लौटने की जरूरत है ट्रस्ट.विद्यार्थीअंतिम तर्क करने के लिए। ऐसा करने के लिए, फॉर्मूला बार में उपयुक्त नाम पर क्लिक करें।

  6. पहले से ही परिचित फ़ंक्शन की तर्क विंडो फिर से खुलती है। कर्सर को फ़ील्ड में सेट करें "आकार". फिर से, ऑपरेटरों की पसंद पर जाने के लिए पहले से परिचित त्रिकोण पर क्लिक करें। जैसा कि आप समझते हैं, हमें एक नाम चाहिए "जांच". चूंकि हमने पिछली पद्धति में गणना में इस फ़ंक्शन का उपयोग किया था, यह इस सूची में मौजूद है, इसलिए बस इस पर क्लिक करें। यदि आपको यह नहीं मिलता है, तो पहले विधि में वर्णित एल्गोरिथम का पालन करें।
  7. तर्क विंडो में प्रवेश करना जांच, कर्सर को फ़ील्ड में रखें "संख्या 1"और माउस बटन को दबाए रखते हुए, संग्रह का चयन करें। फिर बटन पर क्लिक करें ठीक है.
  8. उसके बाद, कार्यक्रम विश्वास अंतराल के मूल्य की गणना और प्रदर्शित करता है।
  9. सीमाओं को निर्धारित करने के लिए, हमें फिर से नमूना माध्य की गणना करने की आवश्यकता होगी। लेकिन, यह देखते हुए कि सूत्र का उपयोग करके गणना एल्गोरिथ्म औसतपिछली पद्धति की तरह ही, और परिणाम भी नहीं बदला है, हम इस पर दूसरी बार विस्तार से ध्यान नहीं देंगे।
  10. गणना के परिणामों को जोड़ना औसततथा ट्रस्ट.विद्यार्थी, हम विश्वास अंतराल की सही सीमा प्राप्त करते हैं।
  11. ऑपरेटर के गणना परिणामों से घटाना औसतगणना परिणाम ट्रस्ट.विद्यार्थी, हमारे पास कॉन्फिडेंस इंटरवल की लेफ्ट बाउंड है।
  12. यदि गणना एक सूत्र में लिखी गई है, तो हमारे मामले में सही सीमा की गणना इस तरह दिखेगी:

    औसत(बी2:बी13)+छात्र विश्वास(0.03,एसटीडीवी(बी2:बी13),काउंट(बी2:बी13))

  13. तदनुसार, बाईं सीमा की गणना करने का सूत्र इस तरह दिखेगा:

    औसत(बी2:बी13)-छात्र विश्वास(0.03,एसटीडीवी(बी2:बी13),काउंट(बी2:बी13))

जैसा कि आप देख सकते हैं, एक्सेल प्रोग्राम के उपकरण आत्मविश्वास अंतराल और इसकी सीमाओं की गणना को काफी सुविधाजनक बनाना संभव बनाते हैं। इन उद्देश्यों के लिए, अलग-अलग ऑपरेटरों का उपयोग उन नमूनों के लिए किया जाता है जिनका विचरण ज्ञात और अज्ञात है।

मान लीजिए कि हमारे पास कुछ विशेषताओं के सामान्य वितरण के साथ बड़ी संख्या में आइटम हैं (उदाहरण के लिए, एक ही प्रकार की सब्जियों का एक पूरा गोदाम, जिसका आकार और वजन भिन्न होता है)। आप माल के पूरे बैच की औसत विशेषताओं को जानना चाहते हैं, लेकिन आपके पास प्रत्येक सब्जी को मापने और तौलने का न तो समय है और न ही झुकाव। आप समझते हैं कि यह आवश्यक नहीं है। लेकिन यादृच्छिक निरीक्षण के लिए आपको कितने टुकड़े लेने होंगे?

इस स्थिति के लिए उपयोगी कुछ सूत्र देने से पहले हमें कुछ संकेतन याद आते हैं।

सबसे पहले, अगर हम सब्जियों के पूरे गोदाम को मापते हैं (तत्वों के इस सेट को सामान्य आबादी कहा जाता है), तो हमें पूरी सटीकता के साथ पूरे बैच के वजन का औसत मूल्य पता चल जाएगा। आइए इस औसत को कॉल करें एक्स सीएफ .जी एन . - सामान्य औसत। हम पहले से ही जानते हैं कि क्या पूरी तरह से निर्धारित होता है यदि इसका माध्य मान और विचलन ज्ञात हो . सच है, अब तक हम न तो X औसत हैं और न हीएस हम सामान्य आबादी को नहीं जानते हैं। हम केवल कुछ नमूना ले सकते हैं, हमारे लिए आवश्यक मूल्यों को माप सकते हैं और इस नमूने के लिए गणना कर सकते हैं, नमूने में माध्य मान X sr. और मानक विचलन S sb दोनों।

यह ज्ञात है कि यदि हमारे कस्टम चेक में बड़ी संख्या में तत्व होते हैं (आमतौर पर n 30 से अधिक होता है), और उन्हें लिया जाता है वास्तव में यादृच्छिक, तो फिर सामान्य जनसंख्या लगभग S से भिन्न नहीं होगी ..

इसके अलावा, सामान्य वितरण के मामले में, हम निम्नलिखित सूत्रों का उपयोग कर सकते हैं:

95% की संभावना के साथ


99% की संभावना के साथ



सामान्य तौर पर, प्रायिकता के साथ (टी)


टी के मूल्य और संभावना पी (टी) के मूल्य के बीच संबंध, जिसके साथ हम विश्वास अंतराल जानना चाहते हैं, निम्न तालिका से लिया जा सकता है:


इस प्रकार, हमने निर्धारित किया है कि सामान्य जनसंख्या के लिए औसत मूल्य किस सीमा में है (एक दी गई संभावना के साथ)।

जब तक हमारे पास पर्याप्त बड़ा नमूना न हो, हम यह दावा नहीं कर सकते कि जनसंख्या में s = . है एस सेल। इसके अलावा, इस मामले में, सामान्य वितरण के लिए नमूने की निकटता समस्याग्रस्त है। इस मामले में, इसके बजाय S sb का भी उपयोग करेंसूत्र में एस:




लेकिन एक निश्चित प्रायिकता P(t) के लिए t का मान नमूना n में तत्वों की संख्या पर निर्भर करेगा। बड़ा n, परिणामी विश्वास अंतराल सूत्र (1) द्वारा दिए गए मान के जितना करीब होगा। इस मामले में t मान एक अन्य तालिका (छात्र का t- परीक्षण) से लिए गए हैं, जो हम नीचे प्रदान करते हैं:

प्रायिकता 0.95 और 0.99 . के लिए विद्यार्थी का t-परीक्षण मान


उदाहरण 3कंपनी के कर्मचारियों में से 30 लोगों को यादृच्छिक रूप से चुना गया था। नमूने के अनुसार, यह पता चला कि औसत वेतन (प्रति माह) 5 हजार रूबल के औसत वर्ग विचलन के साथ 30 हजार रूबल है। 0.99 की संभावना के साथ फर्म में औसत वेतन निर्धारित करें।

समाधान:शर्त के अनुसार, हमारे पास n = 30, X cf है। = 30000, एस = 5000, पी = 0.99। विश्वास अंतराल ज्ञात करने के लिए, हम विद्यार्थी की कसौटी के अनुरूप सूत्र का उपयोग करते हैं। n \u003d 30 और P \u003d 0.99 की तालिका के अनुसार हम t \u003d 2.756 पाते हैं, इसलिए,


वे। वांछित विश्वासअंतराल 27484< Х ср.ген < 32516.

तो, 0.99 की संभावना के साथ, यह तर्क दिया जा सकता है कि अंतराल (27484; 32516) में कंपनी में औसत वेतन शामिल है।

हम आशा करते हैं कि आप हर बार आवश्यक रूप से आपके साथ स्प्रेडशीट के बिना इस पद्धति का उपयोग करेंगे। गणना एक्सेल में स्वचालित रूप से की जा सकती है। एक्सेल फ़ाइल में रहते हुए, शीर्ष मेनू पर fx बटन पर क्लिक करें। फिर, कार्यों में से "सांख्यिकीय" प्रकार का चयन करें, और बॉक्स में प्रस्तावित सूची से - STEUDRASP। फिर, प्रॉम्प्ट पर, कर्सर को "प्रायिकता" फ़ील्ड में रखते हुए, पारस्परिक संभाव्यता का मान टाइप करें (अर्थात, हमारे मामले में, 0.95 की संभावना के बजाय, आपको 0.05 की संभावना टाइप करने की आवश्यकता है)। जाहिरा तौर पर, स्प्रेडशीट को डिज़ाइन किया गया है ताकि परिणाम इस सवाल का जवाब दे कि हम कितने गलत हो सकते हैं। इसी तरह, "स्वतंत्रता की डिग्री" फ़ील्ड में, अपने नमूने के लिए मान (n-1) दर्ज करें।

 

कृपया इस लेख को सोशल मीडिया पर साझा करें यदि यह मददगार था!