भिन्नता का विश्लेषण। पाठ्यक्रम कार्य: विचरण विश्लेषण, विचरण का बहुभिन्नरूपी विश्लेषण

वेरिएंस विश्लेषण सांख्यिकीय विधियों का एक सेट है जिसे कुछ विशेषताओं और अध्ययन किए गए कारकों के बीच संबंधों के बारे में परिकल्पनाओं का परीक्षण करने के लिए डिज़ाइन किया गया है जिनका कोई मात्रात्मक विवरण नहीं है, साथ ही कारकों के प्रभाव की डिग्री और उनकी बातचीत को स्थापित करने के लिए भी डिज़ाइन किया गया है। विशिष्ट साहित्य में इसे अक्सर एनोवा (अंग्रेजी नाम एनालिसिस ऑफ वेरिएशन से) कहा जाता है। इस पद्धति को पहली बार 1925 में आर. फिशर द्वारा विकसित किया गया था।

विचरण के विश्लेषण के प्रकार और मानदंड

इस विधि का उपयोग गुणात्मक (नाममात्र) विशेषताओं और मात्रात्मक (निरंतर) चर के बीच संबंध का अध्ययन करने के लिए किया जाता है। संक्षेप में, यह कई नमूनों के अंकगणितीय माध्य की समानता के बारे में परिकल्पना का परीक्षण करता है। इस प्रकार, इसे एक साथ कई नमूनों के केंद्रों की तुलना करने के लिए एक पैरामीट्रिक मानदंड माना जा सकता है। यदि इस पद्धति का उपयोग दो नमूनों के लिए किया जाता है, तो विचरण के विश्लेषण के परिणाम छात्र के टी-परीक्षण के परिणामों के समान होंगे। हालाँकि, अन्य मानदंडों के विपरीत, यह अध्ययन हमें समस्या का अधिक विस्तार से अध्ययन करने की अनुमति देता है।

आंकड़ों में फैलाव विश्लेषण कानून पर आधारित है: संयुक्त नमूने के वर्ग विचलन का योग वर्ग इंट्राग्रुप विचलन के योग और वर्ग अंतरसमूह विचलन के योग के बराबर है। अध्ययन अंतरसमूह भिन्नताओं और भीतर-समूह भिन्नताओं के बीच अंतर के महत्व को स्थापित करने के लिए फिशर परीक्षण का उपयोग करता है। हालाँकि, इसके लिए आवश्यक शर्तें वितरण की सामान्यता और नमूनों की समरूपता (विचरणों की समानता) हैं। विचरण और बहुभिन्नरूपी (बहुघटकीय) का अविभाज्य (एक-कारक) विश्लेषण होता है। पहला एक विशेषता पर अध्ययन के तहत मूल्य की निर्भरता पर विचार करता है, दूसरा - एक साथ कई पर, और हमें उनके बीच संबंध की पहचान करने की भी अनुमति देता है।

कारकों

कारक नियंत्रित परिस्थितियाँ हैं जो अंतिम परिणाम को प्रभावित करती हैं। इसका स्तर या प्रसंस्करण विधि एक ऐसा मान है जो इस स्थिति की एक विशिष्ट अभिव्यक्ति को दर्शाता है। ये संख्याएँ आमतौर पर नाममात्र या क्रमिक माप पैमाने पर प्रस्तुत की जाती हैं। अक्सर आउटपुट मानों को मात्रात्मक या क्रमिक पैमानों पर मापा जाता है। फिर आउटपुट डेटा को कई अवलोकनों में समूहीकृत करने की समस्या उत्पन्न होती है जो लगभग समान संख्यात्मक मानों के अनुरूप होते हैं। यदि समूहों की संख्या अत्यधिक बड़ी मान ली जाए तो उनमें अवलोकनों की संख्या विश्वसनीय परिणाम प्राप्त करने के लिए अपर्याप्त हो सकती है। यदि आप संख्या बहुत छोटी लेते हैं, तो इससे सिस्टम पर प्रभाव की महत्वपूर्ण विशेषताओं का नुकसान हो सकता है। डेटा को समूहीकृत करने का विशिष्ट तरीका मूल्यों में भिन्नता की मात्रा और प्रकृति पर निर्भर करता है। यूनीवेरिएट विश्लेषण में अंतरालों की संख्या और आकार अक्सर समान अंतराल के सिद्धांत या समान आवृत्तियों के सिद्धांत द्वारा निर्धारित किए जाते हैं।

विचरण समस्याओं का विश्लेषण

इसलिए, ऐसे मामले होते हैं जब आपको दो या दो से अधिक नमूनों की तुलना करने की आवश्यकता होती है। तभी विचरण के विश्लेषण का उपयोग करने की सलाह दी जाती है। विधि का नाम इंगित करता है कि विचरण घटकों के अध्ययन के आधार पर निष्कर्ष निकाले जाते हैं। अध्ययन का सार यह है कि संकेतक में समग्र परिवर्तन को घटक भागों में विभाजित किया गया है जो प्रत्येक व्यक्तिगत कारक की कार्रवाई के अनुरूप है। आइए कई समस्याओं पर विचार करें जिन्हें विचरण के विशिष्ट विश्लेषण द्वारा हल किया जाता है।

उदाहरण 1

कार्यशाला में कई स्वचालित मशीनें हैं जो एक विशिष्ट भाग का उत्पादन करती हैं। प्रत्येक भाग का आकार एक यादृच्छिक चर है जो प्रत्येक मशीन की स्थापना और भागों की निर्माण प्रक्रिया के दौरान होने वाले यादृच्छिक विचलन पर निर्भर करता है। भागों के आयामों के माप डेटा के आधार पर यह निर्धारित करना आवश्यक है कि क्या मशीनें उसी तरह कॉन्फ़िगर की गई हैं।

उदाहरण 2

एक विद्युत उपकरण के निर्माण के दौरान, विभिन्न प्रकार के इंसुलेटिंग पेपर का उपयोग किया जाता है: कैपेसिटर, इलेक्ट्रिकल, आदि। डिवाइस को विभिन्न पदार्थों के साथ संसेचित किया जा सकता है: एपॉक्सी राल, वार्निश, एमएल -2 राल, आदि। लीक को वैक्यूम के तहत समाप्त किया जा सकता है ताप के साथ बढ़ा हुआ दबाव। संसेचन वार्निश में डुबो कर, वार्निश की एक सतत धारा के तहत आदि द्वारा किया जा सकता है। समग्र रूप से विद्युत उपकरण एक निश्चित यौगिक से भरा होता है, जिसके कई विकल्प हैं। गुणवत्ता संकेतक इन्सुलेशन की विद्युत शक्ति, ऑपरेटिंग मोड में वाइंडिंग का अति ताप तापमान और कई अन्य हैं। विनिर्माण उपकरणों की तकनीकी प्रक्रिया के विकास के दौरान, यह निर्धारित करना आवश्यक है कि प्रत्येक सूचीबद्ध कारक डिवाइस के प्रदर्शन को कैसे प्रभावित करता है।

उदाहरण 3

ट्रॉलीबस डिपो कई ट्रॉलीबस मार्गों पर कार्य करता है। वे विभिन्न प्रकार की ट्रॉलीबसें संचालित करते हैं, और 125 निरीक्षक किराया एकत्र करते हैं। डिपो प्रबंधन इस प्रश्न में रुचि रखता है: विभिन्न मार्गों और विभिन्न प्रकार की ट्रॉलीबसों को ध्यान में रखते हुए प्रत्येक नियंत्रक (राजस्व) के काम के आर्थिक संकेतकों की तुलना कैसे करें? किसी विशेष मार्ग पर एक निश्चित प्रकार की ट्रॉलीबस के उत्पादन की आर्थिक व्यवहार्यता का निर्धारण कैसे करें? विभिन्न प्रकार की ट्रॉलीबसों में प्रत्येक मार्ग पर एक कंडक्टर जो राजस्व लाता है, उसके लिए उचित आवश्यकताएं कैसे स्थापित करें?

एक विधि चुनने का कार्य यह है कि अंतिम परिणाम पर प्रत्येक कारक के प्रभाव के संबंध में अधिकतम जानकारी कैसे प्राप्त की जाए, ऐसे प्रभाव की संख्यात्मक विशेषताओं, न्यूनतम लागत पर और कम से कम संभव समय में उनकी विश्वसनीयता निर्धारित की जाए। विचरण विश्लेषण के तरीके ऐसी समस्याओं को हल करने की अनुमति देते हैं।

वस्तु के एक प्रकार विश्लेषण

अध्ययन का उद्देश्य विश्लेषण की गई समीक्षा पर किसी विशेष मामले के प्रभाव की भयावहता का आकलन करना है। यूनीवेरिएट विश्लेषण का एक अन्य उद्देश्य स्मरण पर उनके प्रभाव में अंतर निर्धारित करने के लिए दो या दो से अधिक परिस्थितियों की एक दूसरे के साथ तुलना करना हो सकता है। यदि शून्य परिकल्पना खारिज कर दी जाती है, तो अगला कदम प्राप्त विशेषताओं के लिए आत्मविश्वास अंतराल की मात्रा निर्धारित करना और उसका निर्माण करना है। ऐसे मामले में जहां शून्य परिकल्पना को अस्वीकार नहीं किया जा सकता है, आमतौर पर इसे स्वीकार कर लिया जाता है और प्रभाव की प्रकृति के बारे में निष्कर्ष निकाला जाता है।

विचरण का एक-तरफ़ा विश्लेषण क्रुस्कल-वालिस रैंक पद्धति का एक गैर-पैरामीट्रिक एनालॉग बन सकता है। इसे 1952 में अमेरिकी गणितज्ञ विलियम क्रुस्कल और अर्थशास्त्री विल्सन वालिस द्वारा विकसित किया गया था। यह मानदंड अज्ञात लेकिन समान औसत मूल्यों के साथ अध्ययन किए गए नमूनों पर प्रभावों की समानता की शून्य परिकल्पना का परीक्षण करने के लिए डिज़ाइन किया गया है। इस स्थिति में नमूनों की संख्या दो से अधिक होनी चाहिए।

जॉनखीरे-टेरपस्ट्रा मानदंड को 1952 में डच गणितज्ञ टी.जे. टर्पस्ट्रा और 1954 में ब्रिटिश मनोवैज्ञानिक ई.आर. जोन्कीरे द्वारा स्वतंत्र रूप से प्रस्तावित किया गया था। इसका उपयोग तब किया जाता है जब यह पहले से ज्ञात हो कि परिणामों के मौजूदा समूह प्रभाव की वृद्धि के अनुसार क्रमबद्ध हैं। अध्ययनाधीन कारक, जिसे क्रमिक पैमाने पर मापा जाता है।

एम - 1937 में ब्रिटिश सांख्यिकीविद् मौरिस स्टीवेन्सन बार्टलेट द्वारा प्रस्तावित बार्टलेट परीक्षण का उपयोग कई सामान्य आबादी के भिन्नताओं की समानता के बारे में शून्य परिकल्पना का परीक्षण करने के लिए किया जाता है, जहां से अध्ययन के तहत नमूने लिए जाते हैं, आम तौर पर अलग-अलग आकार होते हैं (प्रत्येक की संख्या) नमूना कम से कम चार होना चाहिए)।

जी - कोचरन का परीक्षण, जिसे 1941 में अमेरिकी विलियम जेमेल कोचरन द्वारा खोजा गया था। इसका उपयोग समान आकार के स्वतंत्र नमूनों में सामान्य आबादी के भिन्नताओं की समानता के बारे में शून्य परिकल्पना का परीक्षण करने के लिए किया जाता है।

1960 में अमेरिकी गणितज्ञ हॉवर्ड लेवेने द्वारा प्रस्तावित नॉनपैरामीट्रिक लेवेने परीक्षण, उन स्थितियों में बार्टलेट परीक्षण का एक विकल्प है जहां कोई भरोसा नहीं है कि अध्ययन के तहत नमूने सामान्य वितरण के अधीन हैं।

1974 में, अमेरिकी सांख्यिकीविद् मॉर्टन बी. ब्राउन और एलन बी. फोर्सिथे ने एक परीक्षण (ब्राउन-फोर्सिथ परीक्षण) प्रस्तावित किया जो लेवेने के परीक्षण से थोड़ा अलग है।

दो-कारक विश्लेषण

विचरण का दो-तरफ़ा विश्लेषण संबंधित सामान्य रूप से वितरित नमूनों के लिए उपयोग किया जाता है। व्यवहार में, इस पद्धति की जटिल तालिकाओं का अक्सर उपयोग किया जाता है, विशेष रूप से वे जिनमें प्रत्येक कोशिका में निश्चित स्तर के मूल्यों के अनुरूप डेटा का एक सेट (बार-बार माप) होता है। यदि विचरण के दो-तरफा विश्लेषण को लागू करने के लिए आवश्यक धारणाएं पूरी नहीं होती हैं, तो 1930 के अंत में अमेरिकी अर्थशास्त्री मिल्टन फ्रीडमैन द्वारा विकसित नॉनपैरामीट्रिक फ्रीडमैन रैंक टेस्ट (फ्रीडमैन, केंडल और स्मिथ) का उपयोग करें। यह परीक्षण प्रकार पर निर्भर नहीं करता है वितरण का.

यह केवल माना जाता है कि मूल्यों का वितरण समान और निरंतर है, और वे स्वयं एक दूसरे से स्वतंत्र हैं। अशक्त परिकल्पना का परीक्षण करते समय, आउटपुट डेटा को एक आयताकार मैट्रिक्स के रूप में प्रस्तुत किया जाता है, जिसमें पंक्तियाँ कारक बी के स्तर के अनुरूप होती हैं, और कॉलम ए के स्तर के अनुरूप होते हैं। तालिका (ब्लॉक) की प्रत्येक कोशिका हो सकती है दोनों कारकों के स्तर के निरंतर मूल्यों के साथ एक वस्तु पर या वस्तुओं के समूह पर मापदंडों के माप का परिणाम। इस मामले में, संबंधित डेटा को अध्ययन के तहत नमूने के सभी आयामों या वस्तुओं के लिए एक निश्चित पैरामीटर के औसत मान के रूप में प्रस्तुत किया जाता है। आउटपुट मानदंड लागू करने के लिए, माप के प्रत्यक्ष परिणामों से उनकी रैंक तक जाना आवश्यक है। रैंकिंग प्रत्येक पंक्ति के लिए अलग से की जाती है, अर्थात प्रत्येक निश्चित मान के लिए मानों का क्रम दिया जाता है।

1963 में अमेरिकी सांख्यिकीविद् ई.बी. पेज द्वारा प्रस्तावित पेज परीक्षण (एल-टेस्ट) को शून्य परिकल्पना का परीक्षण करने के लिए डिज़ाइन किया गया है। बड़े नमूनों के लिए, पेज सन्निकटन का उपयोग किया जाता है। वे, संबंधित शून्य परिकल्पनाओं की वास्तविकता के अधीन, मानक सामान्य वितरण का पालन करते हैं। ऐसे मामले में जहां स्रोत तालिका की पंक्तियों का मान समान है, औसत रैंक का उपयोग करना आवश्यक है। इस मामले में, निष्कर्षों की सटीकता जितनी खराब होगी, ऐसे मैचों की संख्या उतनी ही अधिक होगी।

प्रश्न - कोचरन का मानदंड, 1937 में डब्ल्यू कोचरन द्वारा प्रस्तावित। इसका उपयोग उन मामलों में किया जाता है जहां सजातीय विषयों के समूह प्रभावों के संपर्क में आते हैं, जिनकी संख्या दो से अधिक होती है और जिसके लिए प्रतिक्रिया के लिए दो विकल्प संभव हैं - सशर्त नकारात्मक (0) और सशर्त रूप से सकारात्मक (1) . शून्य परिकल्पना में उपचार प्रभावों की समानता शामिल है। विचरण का दो-तरफ़ा विश्लेषण उपचार प्रभावों के अस्तित्व को निर्धारित करना संभव बनाता है, लेकिन यह निर्धारित करना संभव नहीं बनाता है कि यह प्रभाव किन विशिष्ट स्तंभों के लिए मौजूद है। इस समस्या को हल करने के लिए, संबंधित नमूनों के लिए एकाधिक शेफ़ी समीकरणों की विधि का उपयोग किया जाता है।

बहुभिन्नरूपी विश्लेषण

विचरण के बहुभिन्नरूपी विश्लेषण की समस्या तब उत्पन्न होती है जब आपको एक निश्चित यादृच्छिक चर पर दो या दो से अधिक स्थितियों के प्रभाव को निर्धारित करने की आवश्यकता होती है। अध्ययन में एक आश्रित यादृच्छिक चर की उपस्थिति शामिल है, जिसे अंतर या अनुपात पैमाने पर मापा जाता है, और कई स्वतंत्र चर, जिनमें से प्रत्येक को नामकरण या रैंक पैमाने पर व्यक्त किया जाता है। डेटा का विचरण विश्लेषण गणितीय सांख्यिकी का एक काफी विकसित अनुभाग है, जिसमें बहुत सारे विकल्प हैं। अनुसंधान अवधारणा एकल-कारक और बहु-कारक दोनों के लिए सामान्य है। इसका सार इस तथ्य में निहित है कि कुल विचरण को घटकों में विभाजित किया गया है, जो डेटा के एक निश्चित समूह से मेल खाता है। प्रत्येक डेटा ग्रुपिंग का अपना मॉडल होता है। यहां हम इसके सबसे अधिक उपयोग किए जाने वाले विकल्पों को समझने और व्यावहारिक उपयोग के लिए आवश्यक केवल बुनियादी प्रावधानों पर विचार करेंगे।

कारकों के विचरण विश्लेषण के लिए इनपुट डेटा के संग्रह और प्रस्तुति और विशेष रूप से परिणामों की व्याख्या के लिए काफी सावधान रवैये की आवश्यकता होती है। एक-कारक परीक्षण के विपरीत, जिसके परिणामों को सशर्त रूप से एक निश्चित अनुक्रम में रखा जा सकता है, दो-कारक परीक्षण के परिणामों के लिए अधिक जटिल प्रस्तुति की आवश्यकता होती है। स्थिति तब और भी जटिल हो जाती है जब तीन, चार या अधिक परिस्थितियाँ हों। इस वजह से, एक मॉडल में तीन (चार) से अधिक स्थितियों को शामिल करना काफी दुर्लभ है। एक उदाहरण विद्युत वृत्त की धारिता और प्रेरण के एक निश्चित मूल्य पर प्रतिध्वनि की घटना होगी; तत्वों के एक निश्चित समूह के साथ रासायनिक प्रतिक्रिया की अभिव्यक्ति जिससे सिस्टम बनाया गया है; परिस्थितियों के एक निश्चित संयोग के तहत जटिल प्रणालियों में असामान्य प्रभावों की घटना। अंतःक्रिया की उपस्थिति प्रणाली के मॉडल को मौलिक रूप से बदल सकती है और कभी-कभी उस घटना की प्रकृति पर पुनर्विचार कर सकती है जिसके साथ प्रयोगकर्ता निपट रहा है।

बार-बार प्रयोगों के साथ विचरण का बहुभिन्नरूपी विश्लेषण

मापन डेटा को अक्सर दो नहीं, बल्कि बड़ी संख्या में कारकों द्वारा समूहीकृत किया जा सकता है। इस प्रकार, यदि हम परिस्थितियों (विनिर्माण संयंत्र और जिस मार्ग पर टायर संचालित होते हैं) को ध्यान में रखते हुए ट्रॉलीबस व्हील टायरों की सेवा जीवन के फैलाव विश्लेषण पर विचार करते हैं, तो हम उस मौसम को एक अलग स्थिति के रूप में पहचान सकते हैं जिसके दौरान टायर संचालित होते हैं (अर्थात्: सर्दी और गर्मी का संचालन)। परिणामस्वरूप, हमें त्रि-कारक पद्धति की समस्या होगी।

यदि अधिक स्थितियाँ हैं, तो दृष्टिकोण दो-कारक विश्लेषण के समान ही है। सभी मामलों में, वे मॉडल को सरल बनाने का प्रयास करते हैं। दो कारकों की परस्पर क्रिया की घटना इतनी बार प्रकट नहीं होती है, और ट्रिपल अंतःक्रिया केवल असाधारण मामलों में ही होती है। उन इंटरैक्शन को शामिल करें जिनके लिए पिछली जानकारी है और मॉडल में इसे ध्यान में रखने के अच्छे कारण हैं। व्यक्तिगत कारकों की पहचान करने और उन्हें ध्यान में रखने की प्रक्रिया अपेक्षाकृत सरल है। इसलिए, अक्सर अधिक परिस्थितियों को उजागर करने की इच्छा होती है। आपको इसके चक्कर में नहीं पड़ना चाहिए. जितनी अधिक स्थितियाँ होंगी, मॉडल उतना ही कम विश्वसनीय होगा और त्रुटि की संभावना उतनी ही अधिक होगी। मॉडल, जिसमें बड़ी संख्या में स्वतंत्र चर शामिल हैं, व्याख्या करने में काफी जटिल और व्यावहारिक उपयोग के लिए असुविधाजनक हो जाता है।

विचरण के विश्लेषण का सामान्य विचार

आँकड़ों में भिन्नता का विश्लेषण विभिन्न एक साथ संचालित परिस्थितियों पर निर्भर अवलोकन परिणाम प्राप्त करने और उनके प्रभाव का आकलन करने की एक विधि है। एक नियंत्रित चर जो अध्ययन की वस्तु को प्रभावित करने की विधि से मेल खाता है और एक निश्चित अवधि में एक निश्चित मूल्य प्राप्त करता है, कारक कहलाता है। वे गुणात्मक और मात्रात्मक हो सकते हैं। मात्रात्मक स्थितियों के स्तर संख्यात्मक पैमाने पर एक निश्चित अर्थ प्राप्त करते हैं। उदाहरण तापमान, दबाव दबाव, पदार्थ की मात्रा हैं। गुणात्मक कारक विभिन्न पदार्थ, विभिन्न तकनीकी विधियाँ, उपकरण, भराव हैं। उनका स्तर नामों के पैमाने के अनुरूप है।

गुणवत्ता में पैकेजिंग सामग्री के प्रकार और खुराक के रूप की भंडारण की स्थिति भी शामिल हो सकती है। कच्चे माल की पीसने की डिग्री, कणिकाओं की आंशिक संरचना को शामिल करना भी तर्कसंगत है, जिसका मात्रात्मक महत्व है, लेकिन यदि मात्रात्मक पैमाने का उपयोग किया जाता है तो इसे विनियमित करना मुश्किल होता है। गुणात्मक कारकों की संख्या खुराक के प्रकार के साथ-साथ औषधीय पदार्थों के भौतिक और तकनीकी गुणों पर निर्भर करती है। उदाहरण के लिए, क्रिस्टलीय पदार्थों से सीधे संपीड़न द्वारा गोलियाँ प्राप्त की जा सकती हैं। इस मामले में, स्लाइडिंग और चिकनाई वाले पदार्थों का चयन करना पर्याप्त है।

विभिन्न प्रकार के खुराक रूपों के लिए गुणवत्ता कारकों के उदाहरण

टिंचर।निकालने वाले की संरचना, निकालने वाले का प्रकार, कच्चा माल तैयार करने की विधि, उत्पादन विधि, निस्पंदन विधि।
अर्क (तरल, गाढ़ा, सूखा)।निष्कासक की संरचना, निष्कर्षण विधि, स्थापना का प्रकार, निष्कासक और गिट्टी पदार्थों को निकालने की विधि।
गोलियाँ.सहायक पदार्थ, भराव, विघटनकारी, बाइंडर्स, स्नेहक और स्नेहक की संरचना। टेबलेट प्राप्त करने की विधि, तकनीकी उपकरण का प्रकार। शैल का प्रकार और उसके घटक, फिल्म बनाने वाले, रंगद्रव्य, रंजक, प्लास्टिसाइज़र, सॉल्वैंट्स।
इंजेक्शन समाधान.विलायक का प्रकार, निस्पंदन विधि, स्टेबलाइजर्स और परिरक्षकों की प्रकृति, नसबंदी की स्थिति, ampoules भरने की विधि।
सपोजिटरी।सपोसिटरी बेस की संरचना, सपोसिटरी बनाने की विधि, फिलर्स, पैकेजिंग।
मलहम.आधार की संरचना, संरचनात्मक घटक, मरहम तैयार करने की विधि, उपकरण का प्रकार, पैकेजिंग।
कैप्सूल.शैल सामग्री का प्रकार, कैप्सूल बनाने की विधि, प्लास्टिसाइज़र का प्रकार, परिरक्षक, डाई।
लिनिमेंट।बनाने की विधि, संरचना, उपकरण का प्रकार, इमल्सीफायर का प्रकार।
निलंबन.विलायक का प्रकार, स्टेबलाइजर का प्रकार, फैलाव विधि।

टैबलेट निर्माण प्रक्रिया के दौरान अध्ययन किए गए गुणवत्ता कारकों और उनके स्तरों के उदाहरण

बेकिंग पाउडर।आलू स्टार्च, सफेद मिट्टी, साइट्रिक एसिड के साथ सोडियम बाइकार्बोनेट का मिश्रण, मूल मैग्नीशियम कार्बोनेट।
बाइंडिंग समाधान.पानी, स्टार्च पेस्ट, चीनी सिरप, मिथाइलसेलुलोज घोल, हाइड्रॉक्सीप्रोपाइलमिथाइलसेलुलोज घोल, पॉलीविनाइलपाइरोलिडोन घोल, पॉलीविनाइल अल्कोहल घोल।
फिसलने वाला पदार्थ।एरोसिल, स्टार्च, टैल्क।
भराव.चीनी, ग्लूकोज, लैक्टोज, सोडियम क्लोराइड, कैल्शियम फॉस्फेट।
स्नेहक।स्टीयरिक एसिड, पॉलीइथाइलीन ग्लाइकोल, पैराफिन।

राज्य प्रतिस्पर्धात्मकता के स्तर के अध्ययन में विचरण विश्लेषण के मॉडल

किसी राज्य की स्थिति का आकलन करने के लिए सबसे महत्वपूर्ण मानदंडों में से एक, जिसके द्वारा उसकी भलाई और सामाजिक-आर्थिक विकास के स्तर का आकलन किया जाता है, प्रतिस्पर्धात्मकता है, अर्थात राष्ट्रीय अर्थव्यवस्था में निहित गुणों का एक समूह जो राज्य का निर्धारण करता है। अन्य देशों के साथ प्रतिस्पर्धा करने की क्षमता। विश्व बाजार में राज्य की जगह और भूमिका निर्धारित करने के बाद, अंतरराष्ट्रीय स्तर पर आर्थिक सुरक्षा सुनिश्चित करने के लिए एक स्पष्ट रणनीति स्थापित करना संभव है, क्योंकि यह रूस और विश्व बाजार में सभी खिलाड़ियों के बीच सकारात्मक संबंधों की कुंजी है: निवेशक , लेनदार, और सरकारें।

राज्यों की प्रतिस्पर्धात्मकता के स्तर की तुलना करने के लिए, देशों को जटिल सूचकांकों का उपयोग करके रैंक किया जाता है जिसमें विभिन्न भारित संकेतक शामिल होते हैं। ये सूचकांक आर्थिक, राजनीतिक आदि स्थिति को प्रभावित करने वाले प्रमुख कारकों पर आधारित हैं। राज्य की प्रतिस्पर्धात्मकता का अध्ययन करने के लिए मॉडलों के एक सेट में बहुभिन्नरूपी सांख्यिकीय विश्लेषण विधियों (विशेष रूप से, विचरण (सांख्यिकी) का विश्लेषण, अर्थमितीय मॉडलिंग, निर्णय लेना) का उपयोग शामिल है और इसमें निम्नलिखित मुख्य चरण शामिल हैं:

संकेतकों की एक प्रणाली का गठन.
राज्य प्रतिस्पर्धात्मकता संकेतकों का आकलन और पूर्वानुमान।
राज्यों की प्रतिस्पर्धात्मकता के संकेतकों की तुलना।

आइए अब इस परिसर के प्रत्येक चरण के मॉडल की सामग्री पर नजर डालें।

पहले चरण मेंविशेषज्ञ अध्ययन विधियों का उपयोग करते हुए, राज्य की प्रतिस्पर्धात्मकता का आकलन करने के लिए आर्थिक संकेतकों का एक सुस्थापित सेट बनाया जाता है, जो अंतरराष्ट्रीय रेटिंग और सांख्यिकीय विभागों के डेटा के आधार पर इसके विकास की बारीकियों को ध्यान में रखता है, जो समग्र रूप से सिस्टम की स्थिति को दर्शाता है। और इसकी प्रक्रियाएँ। इन संकेतकों का चुनाव उन संकेतकों को चुनने की आवश्यकता से उचित है जो व्यावहारिक दृष्टिकोण से, हमें राज्य के स्तर, इसके निवेश आकर्षण और मौजूदा क्षमता और वास्तविक खतरों के सापेक्ष स्थानीयकरण की संभावना को निर्धारित करने की अनुमति देते हैं।

अंतर्राष्ट्रीय रेटिंग सिस्टम के मुख्य संकेतक सूचकांक हैं:

वैश्विक प्रतिस्पर्धात्मकता (जीसी)।
आर्थिक स्वतंत्रता (आईईएस)।
मानव विकास (एचडीआई)।
भ्रष्टाचार की धारणाएँ (सीपीसी)।
आंतरिक और बाहरी खतरे (IETH)।
अंतर्राष्ट्रीय प्रभाव क्षमता (आईपीआईपी)।

दूसरा चरणअध्ययन किए जा रहे दुनिया के 139 देशों के लिए अंतरराष्ट्रीय रेटिंग के अनुसार राज्य प्रतिस्पर्धात्मकता संकेतकों का मूल्यांकन और पूर्वानुमान प्रदान करता है।

तीसरा चरणसहसंबंध और प्रतिगमन विश्लेषण के तरीकों का उपयोग करके राज्यों की प्रतिस्पर्धात्मकता की स्थितियों की तुलना प्रदान करता है।

अध्ययन के परिणामों का उपयोग करके, सामान्य रूप से और राज्य की प्रतिस्पर्धात्मकता के व्यक्तिगत घटकों के लिए प्रक्रियाओं की प्रकृति निर्धारित करना संभव है; कारकों के प्रभाव और उनके संबंधों के बारे में परिकल्पना का महत्व के उचित स्तर पर परीक्षण करें।

मॉडलों के प्रस्तावित सेट के कार्यान्वयन से न केवल राज्यों की प्रतिस्पर्धात्मकता और निवेश आकर्षण के स्तर की वर्तमान स्थिति का आकलन करने की अनुमति मिलेगी, बल्कि प्रबंधन की कमियों का विश्लेषण करने, गलत निर्णयों की त्रुटियों को रोकने और संकट के विकास को रोकने की भी अनुमति मिलेगी। राज्य।

भिन्नता का विश्लेषण

1. विचरण के विश्लेषण की अवधारणा

भिन्नता का विश्लेषणकिसी भी नियंत्रित परिवर्तनशील कारकों के प्रभाव में किसी गुण की परिवर्तनशीलता का विश्लेषण है। विदेशी साहित्य में, विचरण के विश्लेषण को अक्सर एनोवा के रूप में जाना जाता है, जिसका अनुवाद परिवर्तनशीलता के विश्लेषण (एनालिसिस ऑफ वेरिएंस) के रूप में किया जाता है।

एनोवा समस्याकिसी गुण की सामान्य परिवर्तनशीलता से भिन्न प्रकार की परिवर्तनशीलता को अलग करना शामिल है:

ए) अध्ययन के तहत प्रत्येक स्वतंत्र चर की कार्रवाई के कारण परिवर्तनशीलता;

बी) अध्ययन किए जा रहे स्वतंत्र चरों की परस्पर क्रिया के कारण परिवर्तनशीलता;

ग) अन्य सभी अज्ञात चरों के कारण यादृच्छिक परिवर्तनशीलता।

अध्ययन के अंतर्गत चरों की क्रिया और उनकी अंतःक्रिया के कारण होने वाली परिवर्तनशीलता यादृच्छिक परिवर्तनशीलता के साथ सहसंबद्ध होती है। इस संबंध का एक संकेतक फिशर का एफ परीक्षण है।

एफ मानदंड की गणना के सूत्र में भिन्नताओं का अनुमान शामिल है, यानी, विशेषता के वितरण पैरामीटर, इसलिए एफ मानदंड एक पैरामीट्रिक मानदंड है।

किसी गुण की परिवर्तनशीलता अध्ययनाधीन चरों (कारकों) या उनकी अंतःक्रिया के कारण जितनी अधिक होगी, उतनी ही अधिक होगी अनुभवजन्य मानदंड मान.

शून्य विचरण के विश्लेषण में परिकल्पना बताएगी कि अध्ययन की गई प्रभावी विशेषता के औसत मूल्य सभी ग्रेडेशन में समान हैं।

विकल्प परिकल्पना बताएगी कि अध्ययन के तहत कारक के विभिन्न ग्रेडेशन में परिणामी विशेषता के औसत मूल्य अलग-अलग हैं।

विचरण का विश्लेषण हमें किसी विशेषता में परिवर्तन बताने की अनुमति देता है, लेकिन संकेत नहीं देता है दिशायह परिवर्तन।

आइए विचरण विश्लेषण पर अपना विचार सबसे सरल मामले से शुरू करें, जब हम केवल की क्रिया का अध्ययन करते हैं एकपरिवर्तनीय (एक कारक)।

2. असंबंधित नमूनों के लिए विचरण का एकतरफा विश्लेषण

2.1. विधि का उद्देश्य

विचरण के एक-कारक विश्लेषण की विधि का उपयोग उन मामलों में किया जाता है जहां किसी कारक की बदलती परिस्थितियों या उन्नयन के प्रभाव में एक प्रभावी विशेषता में परिवर्तन का अध्ययन किया जाता है। विधि के इस संस्करण में, कारक के प्रत्येक ग्रेडेशन का प्रभाव होता है अलगविषयों के नमूने. कारक के कम से कम तीन ग्रेडेशन होने चाहिए। (दो ग्रेडेशन हो सकते हैं, लेकिन इस मामले में हम नॉनलाइनियर निर्भरता स्थापित नहीं कर पाएंगे और सरल निर्भरता का उपयोग करना अधिक उचित लगता है)।

इस प्रकार के विश्लेषण का एक गैर-पैरामीट्रिक संस्करण क्रुस्कल-वालिस एच परीक्षण है।

परिकल्पना

एच 0: कारक ग्रेड (विभिन्न स्थितियों) के बीच अंतर प्रत्येक समूह के भीतर यादृच्छिक अंतर से अधिक नहीं है।

एच 1: कारक ग्रेड (विभिन्न स्थितियों) के बीच अंतर प्रत्येक समूह के भीतर यादृच्छिक अंतर से अधिक है।

2.2. असंबंधित नमूनों के लिए भिन्नता के एक-तरफ़ा विश्लेषण की सीमाएँ

1. विचरण के एक-तरफ़ा विश्लेषण के लिए कारक के कम से कम तीन ग्रेडेशन और प्रत्येक ग्रेडेशन में कम से कम दो विषयों की आवश्यकता होती है।

2. परिणामी विशेषता को अध्ययन के तहत नमूने में सामान्य रूप से वितरित किया जाना चाहिए।

सच है, आमतौर पर यह संकेत नहीं दिया जाता है कि क्या हम संपूर्ण सर्वेक्षण किए गए नमूने में विशेषता के वितरण के बारे में बात कर रहे हैं या उसके उस हिस्से में जो फैलाव परिसर बनाता है।

3. उदाहरण का उपयोग करके असंबद्ध नमूनों के लिए भिन्नता के एक-तरफ़ा विश्लेषण की विधि का उपयोग करके किसी समस्या को हल करने का एक उदाहरण:

छह विषयों के तीन अलग-अलग समूहों को दस-दस शब्दों की सूचियाँ दी गईं। पहले समूह को शब्द कम गति पर प्रस्तुत किए गए - प्रति 5 सेकंड में 1 शब्द, दूसरे समूह को औसत गति पर - 1 शब्द प्रति 2 सेकंड, और तीसरे समूह को उच्च गति पर - 1 शब्द प्रति सेकंड। अनुमान लगाया गया था कि पुनरुत्पादन प्रदर्शन शब्द प्रस्तुति की गति पर निर्भर करेगा। परिणाम तालिका में प्रस्तुत किए गए हैं। 1.

पुनरुत्पादित शब्दों की संख्या तालिका नंबर एक

विषय क्रमांक	धीमी गति	औसत गति	उच्च गति








कुल राशि

एच 0: शब्द उत्पादन अवधि में अंतर बीच मेंसमूह यादृच्छिक मतभेदों से अधिक स्पष्ट नहीं हैं अंदरप्रत्येक समूह।

एच1: शब्द उत्पादन मात्रा में अंतर बीच मेंसमूह यादृच्छिक अंतरों की तुलना में अधिक स्पष्ट होते हैं अंदरप्रत्येक समूह। तालिका में प्रस्तुत प्रयोगात्मक मूल्यों का उपयोग करना। 1, हम कुछ मान स्थापित करेंगे जो एफ मानदंड की गणना के लिए आवश्यक होंगे।

विचरण के एक-तरफ़ा विश्लेषण के लिए मुख्य मात्राओं की गणना तालिका में प्रस्तुत की गई है:

तालिका 2

टेबल तीन

असंबद्ध नमूनों के लिए विचरण के एक-तरफ़ा विश्लेषण में संचालन का अनुक्रम

अक्सर इस और बाद की तालिकाओं में पाया जाता है, पदनाम एसएस "वर्गों के योग" का संक्षिप्त रूप है। इस संक्षिप्त नाम का प्रयोग अक्सर अनुवादित स्रोतों में किया जाता है।

एसएस तथ्यअध्ययन के तहत कारक की कार्रवाई के कारण विशेषता की परिवर्तनशीलता का मतलब है;

एसएस आम तौर पर- विशेषता की सामान्य परिवर्तनशीलता;

एस सीए।-बेहिसाब कारकों के कारण परिवर्तनशीलता, "यादृच्छिक" या "अवशिष्ट" परिवर्तनशीलता।

एमएस- "माध्य वर्ग", या वर्गों के योग की गणितीय अपेक्षा, संबंधित एसएस का औसत मूल्य।

डीएफ - स्वतंत्रता की डिग्री की संख्या, जिसे गैर-पैरामीट्रिक मानदंडों पर विचार करते समय, हम ग्रीक अक्षर द्वारा निरूपित करते हैं वी.

निष्कर्ष: एच 0 को अस्वीकार कर दिया गया है। एच 1 स्वीकृत है. समूहों के बीच शब्द स्मरण में अंतर प्रत्येक समूह के भीतर यादृच्छिक अंतर से अधिक था (α=0.05)। इसलिए, शब्दों की प्रस्तुति की गति उनके पुनरुत्पादन की मात्रा को प्रभावित करती है।

एक्सेल में समस्या को हल करने का एक उदाहरण नीचे प्रस्तुत किया गया है:

आरंभिक डेटा:

कमांड का उपयोग करते हुए: टूल्स->डेटा विश्लेषण->वन-वे एनोवा, हमें निम्नलिखित परिणाम मिलते हैं:

दो साधनों के बीच अंतर के महत्व के बारे में सांख्यिकीय परिकल्पनाओं का परीक्षण करने के लिए ऊपर चर्चा की गई तकनीकों का व्यवहार में सीमित अनुप्रयोग है। यह इस तथ्य के कारण है कि एक प्रभावी विशेषता पर सभी संभावित स्थितियों और कारकों के प्रभाव की पहचान करने के लिए, क्षेत्र और प्रयोगशाला प्रयोग, एक नियम के रूप में, दो नहीं, बल्कि बड़ी संख्या में नमूनों (1220 या अधिक) का उपयोग करके किए जाते हैं। ).

अक्सर शोधकर्ता एक ही परिसर में संयुक्त कई नमूनों के साधनों की तुलना करते हैं। उदाहरण के लिए, फसल की पैदावार पर उर्वरकों के विभिन्न प्रकारों और खुराकों के प्रभाव का अध्ययन करते समय, प्रयोगों को विभिन्न संस्करणों में दोहराया जाता है। इन मामलों में, जोड़ीवार तुलना बोझिल हो जाती है, और पूरे परिसर के सांख्यिकीय विश्लेषण के लिए एक विशेष विधि के उपयोग की आवश्यकता होती है। गणितीय सांख्यिकी में विकसित इस विधि को प्रसरण का विश्लेषण कहा जाता है। इसका उपयोग पहली बार अंग्रेजी सांख्यिकीविद् आर. फिशर द्वारा कृषि विज्ञान प्रयोगों (1938) के परिणामों को संसाधित करते समय किया गया था।

भिन्नता का विश्लेषणएक या अधिक कारकों पर किसी प्रभावी विशेषता की निर्भरता की अभिव्यक्ति की विश्वसनीयता का सांख्यिकीय रूप से आकलन करने की एक विधि है। विचरण विश्लेषण की विधि का उपयोग करके, सामान्य वितरण वाली कई सामान्य आबादी में औसत के संबंध में सांख्यिकीय परिकल्पनाओं का परीक्षण किया जाता है।

प्रयोगात्मक परिणामों के सांख्यिकीय मूल्यांकन के लिए विचरण का विश्लेषण मुख्य तरीकों में से एक है। आर्थिक जानकारी के विश्लेषण में भी इसका उपयोग तेजी से हो रहा है। विचरण का विश्लेषण यह स्थापित करना संभव बनाता है कि परिणामी और कारक विशेषताओं के बीच संबंध के नमूना संकेतक किस हद तक नमूने से प्राप्त डेटा को सामान्य जनसंख्या तक विस्तारित करने के लिए पर्याप्त हैं। इस पद्धति का लाभ यह है कि यह छोटे नमूनों से काफी विश्वसनीय निष्कर्ष देती है।

विचरण विश्लेषण का उपयोग करके एक या कई कारकों के प्रभाव में एक प्रभावी विशेषता की भिन्नता का अध्ययन करके, निर्भरता के महत्व के सामान्य अनुमानों के अलावा, बनने वाले साधनों के परिमाण में अंतर का आकलन भी प्राप्त किया जा सकता है। कारकों के विभिन्न स्तरों पर, और कारकों की परस्पर क्रिया का महत्व। विचरण के विश्लेषण का उपयोग मात्रात्मक और गुणात्मक दोनों विशेषताओं की निर्भरता के साथ-साथ उनके संयोजन का अध्ययन करने के लिए किया जाता है।

इस पद्धति का सार एक या एक से अधिक कारकों के प्रभाव की संभावना के साथ-साथ परिणामी विशेषता पर उनकी बातचीत का सांख्यिकीय अध्ययन है। इसके अनुसार, विचरण विश्लेषण का उपयोग करके तीन मुख्य कार्य हल किए जाते हैं: 1) समूह साधनों के बीच अंतर के महत्व का सामान्य मूल्यांकन; 2) कारकों के बीच परस्पर क्रिया की संभावना का आकलन करना; 3) साधनों के जोड़े के बीच अंतर के महत्व का आकलन। अक्सर, शोधकर्ताओं को फ़ील्ड और ज़ूटेक्निकल प्रयोगों का संचालन करते समय ऐसी समस्याओं को हल करना पड़ता है, जब एक प्रभावी विशेषता पर कई कारकों के प्रभाव का अध्ययन किया जाता है।

विचरण विश्लेषण की सिद्धांत योजना में प्रभावी विशेषता में भिन्नता के मुख्य स्रोतों को स्थापित करना और इसके गठन के स्रोतों के अनुसार भिन्नता की मात्रा (वर्ग विचलन का योग) निर्धारित करना शामिल है; कुल भिन्नता के घटकों के अनुरूप स्वतंत्रता की डिग्री की संख्या निर्धारित करना; भिन्नता की संगत मात्राओं और उनकी स्वतंत्रता की डिग्री की संख्या के अनुपात के रूप में फैलाव की गणना करना; भिन्नताओं के बीच संबंध का विश्लेषण; साधनों के बीच अंतर की विश्वसनीयता का आकलन करना और निष्कर्ष निकालना।

यह योजना विचरण विश्लेषण के सरल मॉडलों में, जब डेटा को एक विशेषता द्वारा समूहीकृत किया जाता है, और जटिल मॉडल में, जब डेटा को दो या दो से अधिक विशेषताओं द्वारा समूहीकृत किया जाता है, दोनों में संरक्षित किया जाता है। हालाँकि, समूह विशेषताओं की संख्या में वृद्धि के साथ, इसके गठन के स्रोतों के अनुसार कुल भिन्नता को विघटित करने की प्रक्रिया अधिक जटिल हो जाती है।

सिद्धांत आरेख के अनुसार, विचरण का विश्लेषण पांच अनुक्रमिक चरणों के रूप में दर्शाया जा सकता है:

1) भिन्नता की परिभाषा और विस्तार;

2) भिन्नता की स्वतंत्रता की डिग्री की संख्या का निर्धारण;

3) प्रसरण और उनके अनुपात की गणना;

4) भिन्नताओं और उनके संबंधों का विश्लेषण;

5) शून्य परिकल्पना के परीक्षण के लिए साधनों के बीच अंतर के महत्व का आकलन करना और निष्कर्ष तैयार करना।

विचरण विश्लेषण का सबसे श्रम-गहन हिस्सा पहला चरण है - इसके गठन के स्रोतों के अनुसार भिन्नता का निर्धारण और विघटित करना। भिन्नता की कुल मात्रा के अपघटन क्रम पर अध्याय 5 में विस्तार से चर्चा की गई थी।

विचरण विश्लेषण की समस्याओं को हल करने का आधार भिन्नता के विस्तार (जोड़ने) का नियम है, जिसके अनुसार परिणामी विशेषता की कुल भिन्नता (उतार-चढ़ाव) को दो में विभाजित किया गया है: अध्ययन के तहत कारक (कारकों) की कार्रवाई के कारण होने वाली भिन्नता , और यादृच्छिक कारणों की कार्रवाई के कारण होने वाली भिन्नता, अर्थात्

आइए मान लें कि अध्ययन के तहत जनसंख्या को कारक विशेषताओं के अनुसार कई समूहों में विभाजित किया गया है, जिनमें से प्रत्येक को परिणामी विशेषता के अपने औसत मूल्य की विशेषता है। साथ ही, इन मूल्यों की भिन्नता को दो प्रकार के कारणों से समझाया जा सकता है: वे जो प्रभावी संकेत पर व्यवस्थित रूप से कार्य करते हैं और प्रयोग के दौरान समायोजित किए जा सकते हैं, और वे जिन्हें समायोजित नहीं किया जा सकता है। यह स्पष्ट है कि अंतरसमूह (तथ्यात्मक या व्यवस्थित) भिन्नता मुख्य रूप से अध्ययन के तहत कारक की कार्रवाई पर निर्भर करती है, और इंट्राग्रुप (अवशिष्ट या यादृच्छिक) भिन्नता मुख्य रूप से यादृच्छिक कारकों की कार्रवाई पर निर्भर करती है।

समूह साधनों के बीच अंतर की विश्वसनीयता का आकलन करने के लिए, अंतरसमूह और इंट्राग्रुप विविधताओं को निर्धारित करना आवश्यक है। यदि इंटरग्रुप (फैक्टोरियल) भिन्नता इंट्राग्रुप (अवशिष्ट) भिन्नता से काफी अधिक है, तो कारक ने परिणामी विशेषता को प्रभावित किया, जिससे समूह औसत के मूल्यों में काफी बदलाव आया। लेकिन सवाल यह उठता है कि अंतरसमूह और अंतरसमूह विविधताओं के बीच क्या संबंध है जिसे समूह साधनों के बीच अंतर की विश्वसनीयता (महत्व) का निष्कर्ष निकालने के लिए पर्याप्त माना जा सकता है।

विचरण विश्लेषण में शून्य परिकल्पना (H0:x1 = x2 =... = xn) के परीक्षण के लिए साधनों के बीच अंतर के महत्व का आकलन करने और निष्कर्ष तैयार करने के लिए, एक प्रकार के मानक का उपयोग किया जाता है - जी-मानदंड, वितरण कानून जिसकी स्थापना आर. फिशर ने की थी। यह मानदंड दो भिन्नताओं का अनुपात है: तथ्यात्मक, अध्ययन के तहत कारक की कार्रवाई से उत्पन्न, और यादृच्छिक कारणों की कार्रवाई के कारण अवशिष्ट:

फैलाव संबंध Γ = £>u : अमेरिकी सांख्यिकीविद् स्नेडेकोर ने विचरण विश्लेषण के आविष्कारक, आर. फिशर के सम्मान में £*2 को अक्षर G से दर्शाने का प्रस्ताव रखा।

प्रसरण °2 io2 जनसंख्या प्रसरण के अनुमान हैं। यदि भिन्नता °2 °2 वाले नमूने उसी सामान्य जनसंख्या से बनाए गए हैं, जहां मानों की भिन्नता यादृच्छिक थी, तो °2 °2 मानों में विसंगति भी यादृच्छिक है।

यदि कोई प्रयोग एक प्रभावी गुण पर एक साथ कई कारकों (ए, बी, सी, आदि) के प्रभाव का परीक्षण करता है, तो उनमें से प्रत्येक की कार्रवाई के कारण भिन्नता तुलनीय होनी चाहिए °ई.जीपी, वह है

यदि कारक फैलाव का मूल्य अवशिष्ट से काफी अधिक है, तो कारक ने परिणामी विशेषता को महत्वपूर्ण रूप से प्रभावित किया और इसके विपरीत।

बहुक्रियात्मक प्रयोगों में, प्रत्येक कारक की क्रिया के कारण भिन्नता के अलावा, कारकों की परस्पर क्रिया ($ав: ^лс ^вс $ліс) के कारण लगभग हमेशा भिन्नता होती है। बातचीत का सार यह है कि एक कारक का प्रभाव दूसरे के विभिन्न स्तरों पर महत्वपूर्ण रूप से बदलता है (उदाहरण के लिए, उर्वरकों की विभिन्न खुराक पर मिट्टी की गुणवत्ता की प्रभावशीलता)।

संबंधित भिन्नताओं 3 ^v.gr की तुलना करके कारकों की परस्पर क्रिया का भी आकलन किया जाना चाहिए:

बी-मानदंड के वास्तविक मूल्य की गणना करते समय, बड़े भिन्नताओं को अंश में लिया जाता है, इसलिए बी> 1। जाहिर है, बी मानदंड जितना बड़ा होगा, भिन्नताओं के बीच अंतर उतना ही अधिक महत्वपूर्ण होगा। यदि बी = 1, तो भिन्नताओं में अंतर के महत्व का आकलन करने का प्रश्न हटा दिया जाता है।

फैलाव के अनुपात में यादृच्छिक उतार-चढ़ाव की सीमा निर्धारित करने के लिए, जी. फिशर ने विशेष बी-वितरण तालिकाएं (परिशिष्ट 4 और 5) विकसित कीं। मानदंड कार्यात्मक रूप से संभाव्यता से संबंधित होगा और भिन्नता की स्वतंत्रता की डिग्री की संख्या पर निर्भर करता है k1और दो तुलनात्मक भिन्नताओं में से k2। आमतौर पर, 0.05 और 0.01 के महत्व स्तरों के लिए मानदंड के अत्यधिक उच्च मूल्य के बारे में निष्कर्ष निकालने के लिए दो तालिकाओं का उपयोग किया जाता है। 0.05 (या 5%) के महत्व स्तर का मतलब है कि 100 में से केवल 5 मामलों में मानदंड बी तालिका में दर्शाए गए मूल्य के बराबर या उससे अधिक मान ले सकता है। महत्व स्तर को 0.05 से घटाकर 0.01 करने से केवल यादृच्छिक कारणों के प्रभाव से दो भिन्नताओं के बीच मानदंड के मूल्य में वृद्धि होती है।

मानदंड का मूल्य तुलना की जा रही दो प्रकीर्णनों की स्वतंत्रता की डिग्री की संख्या पर भी सीधे निर्भर करता है। यदि स्वतंत्रता की कोटि की संख्या अनंत (k-me) की ओर प्रवृत्त होती है, तो दो विचरणों के लिए अनुपात B, एकता की ओर प्रवृत्त होता है।

मानदंड बी का सारणीबद्ध मान किसी दिए गए महत्व स्तर पर दो भिन्नताओं के अनुपात के संभावित यादृच्छिक मूल्य और तुलना किए जा रहे प्रत्येक भिन्नता के लिए स्वतंत्रता की डिग्री की संबंधित संख्या को दर्शाता है। संकेतित तालिकाएँ समान सामान्य जनसंख्या से बने नमूनों के लिए बी का मान दिखाती हैं, जहाँ मूल्यों में परिवर्तन के कारण केवल यादृच्छिक हैं।

Γ का मान तालिकाओं (परिशिष्ट 4 और 5) से संबंधित कॉलम (अधिक फैलाव के लिए स्वतंत्रता की डिग्री की संख्या - k1) और पंक्ति (कम फैलाव के लिए स्वतंत्रता की डिग्री की संख्या - k2) के चौराहे पर पाया जाता है। ). इसलिए, यदि बड़ा विचरण (अंश Г) k1 = 4 है, और छोटा विचरण (हर Г) k2 = 9 है, तो महत्व स्तर а = 0.05 पर Г 3.63 होगा (परिशिष्ट 4)। इसलिए, यादृच्छिक कारणों के परिणामस्वरूप, चूंकि नमूने छोटे हैं, एक नमूने का विचरण, 5% महत्व स्तर पर, दूसरे नमूने के विचरण से 3.63 गुना अधिक हो सकता है। जब महत्व स्तर 0.05 से घटकर 0.01 हो जाता है, तो मानदंड जी का सारणीबद्ध मान, जैसा कि ऊपर बताया गया है, बढ़ जाएगा। इस प्रकार, स्वतंत्रता की समान डिग्री k1 = 4 और k2 = 9 और a = 0.01 के साथ, मानदंड G का सारणीबद्ध मान 6.99 होगा (परिशिष्ट 5)।

आइए विचरण विश्लेषण में स्वतंत्रता की डिग्री की संख्या निर्धारित करने की प्रक्रिया पर विचार करें। स्वतंत्रता की डिग्री की संख्या, जो वर्ग विचलन के कुल योग से मेल खाती है, वर्ग विचलन के योग के अपघटन के समान संबंधित घटकों में विघटित हो जाती है (^कुल = No^gr + ]¥vhr), अर्थात, स्वतंत्रता की डिग्री की कुल संख्या (k") को अंतरसमूह (k1) और इंट्राग्रुप (k2) विविधताओं के लिए स्वतंत्रता की डिग्री की संख्या में विघटित किया जाता है।

इस प्रकार, यदि एक नमूना जनसंख्या से मिलकर बनता है एनअवलोकनों को विभाजित किया गया है टी समूह (प्रायोगिक विकल्पों की संख्या) और पी उपसमूह (दोहराव की संख्या), तो स्वतंत्रता की डिग्री की संख्या k तदनुसार होगी:

ए) वर्ग विचलन के कुल योग के लिए (s7zag)

बी) वर्ग विचलन के अंतरसमूह योग के लिए ^एम.जीपी)

ग) वर्ग विचलनों के इंट्राग्रुप योग के लिए वी v.gR)

विविधताएँ जोड़ने के नियम के अनुसार:

उदाहरण के लिए, यदि किसी प्रयोग में प्रयोग के चार प्रकार बनाए गए (t = 4) प्रत्येक पांच पुनरावृत्तियों में (n = 5), और अवलोकनों की कुल संख्या N = = है टीओपी = 4 * 5 = 20, तो स्वतंत्रता की डिग्री की संख्या तदनुसार बराबर है:

वर्ग विचलनों का योग और स्वतंत्रता की डिग्री की संख्या जानने के बाद, हम तीन भिन्नताओं के लिए निष्पक्ष (सही) अनुमान निर्धारित कर सकते हैं:

शून्य परिकल्पना H0 का परीक्षण मानदंड B का उपयोग करके उसी तरह किया जाता है जैसे छात्र के t-परीक्षण का उपयोग करके किया जाता है। H0 की जाँच पर निर्णय लेने के लिए, मानदंड के वास्तविक मूल्य की गणना करना और स्वीकृत महत्व स्तर a और स्वतंत्रता की डिग्री की संख्या के लिए सारणीबद्ध मान Ba के साथ इसकी तुलना करना आवश्यक है। k1और दो प्रकीर्णन के लिए k2।

यदि Bfaq > Ba, तो, महत्व के स्वीकृत स्तर के अनुसार, हम यह निष्कर्ष निकाल सकते हैं कि नमूना भिन्नताओं में अंतर न केवल यादृच्छिक कारकों द्वारा निर्धारित किया जाता है; वे महत्वपूर्ण हैं. इस मामले में, शून्य परिकल्पना खारिज कर दी जाती है और यह दावा करने का कारण है कि कारक परिणामी विशेषता को महत्वपूर्ण रूप से प्रभावित करता है। अगर< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

किसी विशेष विचरण विश्लेषण मॉडल का उपयोग अध्ययन किए जा रहे कारकों की संख्या और नमूने लेने की विधि दोनों पर निर्भर करता है।

सी परिणामी विशेषता की भिन्नता निर्धारित करने वाले कारकों की संख्या के आधार पर, नमूने एक, दो या अधिक कारकों के अनुसार बनाए जा सकते हैं। इसके अनुसार विचरण के विश्लेषण को एकल-कारक और बहु-कारक में विभाजित किया गया है। अन्यथा, इसे एकल-कारक और बहुकारक फैलाव परिसर भी कहा जाता है।

कुल भिन्नता की अपघटन योजना समूहों के गठन पर निर्भर करती है। यह यादृच्छिक हो सकता है (एक समूह के अवलोकन दूसरे समूह के अवलोकन से संबंधित नहीं हैं) और गैर-यादृच्छिक (दो नमूनों के अवलोकन सामान्य प्रयोगात्मक स्थितियों द्वारा एक दूसरे से संबंधित हैं)। स्वतंत्र और आश्रित नमूने तदनुसार प्राप्त किए जाते हैं। स्वतंत्र नमूने समान और असमान दोनों संख्याओं से बनाए जा सकते हैं। आश्रित नमूनों का निर्माण उनके समान आकार को मानता है।

यदि समूह यादृच्छिक क्रम में बनाए जाते हैं, तो परिणामी विशेषता की भिन्नता की कुल मात्रा में तथ्यात्मक (अंतरसमूह) और अवशिष्ट भिन्नता के साथ, दोहराव की भिन्नता भी शामिल होती है, अर्थात

व्यवहार में, ज्यादातर मामलों में समूहों और उपसमूहों की स्थितियाँ बराबर होने पर आश्रित नमूनों पर विचार करना आवश्यक होता है। इसलिए, एक फ़ील्ड प्रयोग में, पूरी साइट को सबसे विविध स्थितियों के साथ ब्लॉकों में विभाजित किया गया है। इस मामले में, प्रयोग के प्रत्येक संस्करण को सभी ब्लॉकों में प्रतिनिधित्व करने के समान अवसर मिलते हैं, जिससे प्रयोग के सभी परीक्षण किए गए वेरिएंट के लिए स्थितियां समान हो जाती हैं। किसी प्रयोग के निर्माण की इस विधि को यादृच्छिक ब्लॉक विधि कहा जाता है। जानवरों के साथ प्रयोग भी इसी तरह किए जाते हैं।

विचरण विश्लेषण पद्धति का उपयोग करके सामाजिक-आर्थिक डेटा को संसाधित करते समय, यह ध्यान रखना आवश्यक है कि बड़ी संख्या में कारकों और उनके अंतर्संबंध के कारण, उद्देश्य की डिग्री स्थापित करना, यहां तक कि स्थितियों के सबसे सावधानीपूर्वक स्तर के साथ भी मुश्किल है। परिणामी विशेषता पर प्रत्येक व्यक्तिगत कारक का प्रभाव। इसलिए, अवशिष्ट भिन्नता का स्तर न केवल यादृच्छिक कारणों से निर्धारित होता है, बल्कि महत्वपूर्ण कारकों द्वारा भी निर्धारित होता है जिन्हें विचरण विश्लेषण मॉडल का निर्माण करते समय ध्यान में नहीं रखा गया था। इसके परिणामस्वरूप, तुलना के आधार के रूप में अवशिष्ट भिन्नता कभी-कभी अपने उद्देश्य के लिए अपर्याप्त हो जाती है; यह स्पष्ट रूप से मूल्य में अधिक अनुमानित है और कारकों के प्रभाव के महत्व के लिए एक मानदंड के रूप में कार्य नहीं कर सकता है। इस संबंध में, विचरण विश्लेषण मॉडल का निर्माण करते समय, सबसे महत्वपूर्ण कारकों का चयन करने और उनमें से प्रत्येक की कार्रवाई की अभिव्यक्ति के लिए शर्तों को समतल करने की समस्या प्रासंगिक हो जाती है। अलावा। विचरण विश्लेषण का उपयोग अध्ययन के तहत सांख्यिकीय आबादी के सामान्य या सामान्य वितरण के करीब मानता है। यदि यह शर्त पूरी नहीं होती है, तो विचरण के विश्लेषण में प्राप्त अनुमान अतिरंजित होंगे।

व्यक्ति अपनी क्षमताओं को पहचान कर उन्हें क्रियान्वित करने का प्रयास करके ही पहचान सकता है। (सेनेका)

भिन्नता का विश्लेषण

परिचयात्मक सिंहावलोकन

इस अनुभाग में, हम एनोवा की बुनियादी विधियों, मान्यताओं और शब्दावली की समीक्षा करेंगे।

ध्यान दें कि अंग्रेजी भाषा के साहित्य में, भिन्नता के विश्लेषण को आमतौर पर भिन्नता का विश्लेषण कहा जाता है। इसलिए, संक्षिप्तता के लिए, नीचे हम कभी-कभी इस शब्द का उपयोग करेंगे एनोवा (एकविश्लेषण हेएफ वाराशन) साधारण एनोवा और शब्द के लिए मनोवाविचरण के बहुभिन्नरूपी विश्लेषण के लिए। इस अनुभाग में हम विचरण के विश्लेषण के मुख्य विचारों की क्रमिक समीक्षा करेंगे ( एनोवा), सहप्रसरण का विश्लेषण ( एंकोवा), विचरण का बहुभिन्नरूपी विश्लेषण ( मनोवा) और सहप्रसरण का बहुभिन्नरूपी विश्लेषण ( मनकोवा). कंट्रास्ट विश्लेषण और पोस्ट हॉक परीक्षणों की खूबियों की संक्षिप्त चर्चा के बाद, आइए उन धारणाओं पर नजर डालें जिन पर एनोवा विधियां आधारित हैं। इस खंड के अंत में, पारंपरिक अविभाज्य दृष्टिकोण की तुलना में बार-बार माप विश्लेषण के लिए बहुभिन्नरूपी दृष्टिकोण के फायदे बताए गए हैं।

प्रमुख विचार

विचरण के विश्लेषण का उद्देश्य.विचरण के विश्लेषण का मुख्य उद्देश्य साधनों के बीच अंतर के महत्व की जांच करना है। अध्याय (अध्याय 8) सांख्यिकीय महत्व के अध्ययन का संक्षिप्त परिचय प्रदान करता है। यदि आप केवल दो नमूनों के माध्य की तुलना कर रहे हैं, तो विचरण का विश्लेषण सामान्य विश्लेषण के समान परिणाम देगा। टी- स्वतंत्र नमूनों के लिए परीक्षण (यदि वस्तुओं या अवलोकनों के दो स्वतंत्र समूहों की तुलना की जाती है) या टी- आश्रित नमूनों के लिए मानदंड (यदि दो चर की तुलना वस्तुओं या अवलोकनों के एक ही सेट पर की जाती है)। यदि आप इन मानदंडों से परिचित नहीं हैं, तो हम अनुशंसा करते हैं कि आप परिचयात्मक अध्याय अवलोकन देखें (अध्याय 9).

नाम कहां से आया भिन्नता का विश्लेषण? यह अजीब लग सकता है कि साधनों की तुलना करने की प्रक्रिया को विचरण का विश्लेषण कहा जाता है। वास्तव में, ऐसा इसलिए है क्योंकि जब हम साधनों के बीच अंतर के सांख्यिकीय महत्व की जांच करते हैं, तो हम वास्तव में भिन्नताओं का विश्लेषण कर रहे होते हैं।

वर्गों के योग का विभाजन

नमूना आकार n के लिए, नमूना विचरण की गणना नमूना माध्य से वर्ग विचलन के योग को n-1 (नमूना आकार शून्य से एक) से विभाजित करके की जाती है। इस प्रकार, एक निश्चित नमूना आकार n के लिए, विचरण वर्गों (विचलन) के योग का एक कार्य है, जिसे संक्षिप्तता के लिए दर्शाया गया है, एसएस(अंग्रेजी से वर्गों का योग - वर्गों का योग)। विचरण विश्लेषण का आधार विचरण को भागों में अलग करना (या विभाजित करना) है। निम्नलिखित डेटा सेट पर विचार करें:

दोनों समूहों के साधन काफी भिन्न हैं (क्रमशः 2 और 6)। वर्ग विचलनों का योग अंदरप्रत्येक समूह 2 के बराबर है। उन्हें जोड़ने पर, हमें 4 मिलता है। यदि हम अब इन गणनाओं को दोहराते हैं के सिवासमूह सदस्यता, अर्थात यदि हम गणना करें एसएसदो नमूनों के समग्र माध्य के आधार पर, हमें 28 मिलते हैं। दूसरे शब्दों में, समूह के भीतर परिवर्तनशीलता के आधार पर विचरण (वर्गों का योग) का परिणाम समग्र परिवर्तनशीलता (के सापेक्ष) के आधार पर गणना करने की तुलना में बहुत कम होता है। समग्र माध्य)। इसका कारण स्पष्ट रूप से साधनों के बीच एक महत्वपूर्ण अंतर है, और साधनों के बीच यह अंतर वर्गों के योग के बीच मौजूदा अंतर को स्पष्ट करता है। वास्तव में, यदि आप दिए गए डेटा का विश्लेषण करने के लिए मॉड्यूल का उपयोग करते हैं भिन्नता का विश्लेषण, निम्नलिखित परिणाम प्राप्त होंगे:

जैसा कि तालिका से देखा जा सकता है, वर्गों का कुल योग एसएस=28 को दिए गए वर्गों के योग से विभाजित किया जाता है इंट्राग्रुपपरिवर्तनशीलता ( 2+2=4 ; तालिका की दूसरी पंक्ति देखें) और माध्य मानों में अंतर के कारण वर्गों का योग। (28-(2+2)=24; तालिका की पहली पंक्ति देखें)।

एसएस त्रुटियाँ औरएसएस प्रभाव।समूह के भीतर परिवर्तनशीलता ( एसएस) को आमतौर पर फैलाव कहा जाता है त्रुटियाँ.इसका मतलब यह है कि जब कोई प्रयोग किया जाता है तो आमतौर पर इसकी भविष्यवाणी या व्याख्या नहीं की जा सकती है। दूसरी ओर, एसएस प्रभाव(या समूह के बीच परिवर्तनशीलता) को अध्ययन समूहों के साधनों के बीच अंतर द्वारा समझाया जा सकता है। दूसरे शब्दों में, एक निश्चित समूह से संबंधित बताते हैंअंतरसमूह परिवर्तनशीलता, क्योंकि हम जानते हैं कि इन समूहों के अलग-अलग साधन हैं।

महत्व की जाँच.अध्याय में सांख्यिकीय महत्व परीक्षण के मूल विचारों पर चर्चा की गई है सांख्यिकी की बुनियादी अवधारणाएँ(अध्याय 8). यह अध्याय उन कारणों की भी व्याख्या करता है कि क्यों कई परीक्षण स्पष्ट और अस्पष्टीकृत विचरण के अनुपात का उपयोग करते हैं। इस प्रयोग का एक उदाहरण स्वयं विचरण का विश्लेषण है। एनोवा में महत्व का परीक्षण समूह-समूह भिन्नता (जिसे कहा जाता है) के कारण भिन्नता की तुलना करने पर आधारित है माध्य वर्ग प्रभावया एमएसप्रभाव) और समूह के भीतर भिन्नता के कारण भिन्नता (कहा जाता है)। मतलब चुकता त्रुटिया एमएसगलती). यदि शून्य परिकल्पना (दो आबादी में साधनों की समानता) सत्य है, तो किसी को यादृच्छिक भिन्नता के कारण नमूना साधनों में अपेक्षाकृत कम अंतर की उम्मीद होगी। इसलिए, शून्य परिकल्पना के तहत, समूह के भीतर का विचरण व्यावहारिक रूप से समूह सदस्यता को ध्यान में रखे बिना गणना किए गए कुल विचरण के साथ मेल खाएगा। समूह के भीतर परिणामी भिन्नताओं की तुलना का उपयोग करके की जा सकती है एफ- परीक्षण जो जाँचता है कि क्या विचरण अनुपात 1 से काफी अधिक है। ऊपर चर्चा किए गए उदाहरण में एफ- मानदंड दर्शाता है कि साधनों के बीच का अंतर सांख्यिकीय रूप से महत्वपूर्ण है।

विचरण के विश्लेषण का मूल तर्क.संक्षेप में कहें तो, एनोवा का उद्देश्य साधनों (समूहों या चरों के लिए) के बीच अंतर के सांख्यिकीय महत्व का परीक्षण करना है। यह जाँच विचरण के विश्लेषण का उपयोग करके की जाती है, अर्थात। कुल विचरण (भिन्नता) को भागों में विभाजित करके, जिनमें से एक यादृच्छिक त्रुटि (अर्थात इंट्राग्रुप परिवर्तनशीलता) के कारण होता है, और दूसरा माध्य मानों में अंतर से जुड़ा होता है। अंतिम विचरण घटक का उपयोग साधनों के बीच अंतर के सांख्यिकीय महत्व का विश्लेषण करने के लिए किया जाता है। यदि यह अंतर महत्वपूर्ण है, तो शून्य परिकल्पना को अस्वीकार कर दिया जाता है और वैकल्पिक परिकल्पना को स्वीकार कर लिया जाता है कि साधनों के बीच अंतर है।

आश्रित और स्वतंत्र चर.वे चर जिनका मान किसी प्रयोग के दौरान माप द्वारा निर्धारित किया जाता है (उदाहरण के लिए, एक परीक्षण स्कोर) कहलाते हैं आश्रितचर। वे चर जिन्हें किसी प्रयोग में नियंत्रित किया जा सकता है (उदाहरण के लिए, शिक्षण विधियों या अवलोकनों को समूहों में विभाजित करने के अन्य मानदंड) कहलाते हैं कारकोंया स्वतंत्रचर। इन अवधारणाओं का अध्याय में अधिक विस्तार से वर्णन किया गया है सांख्यिकी की बुनियादी अवधारणाएँ(अध्याय 8).

विचरण का बहुभिन्नरूपी विश्लेषण

उपरोक्त सरल उदाहरण में, आप उचित मॉड्यूल विकल्प का उपयोग करके तुरंत स्वतंत्र नमूने टी-परीक्षण की गणना कर सकते हैं बुनियादी आँकड़े और तालिकाएँ।प्राप्त परिणाम स्वाभाविक रूप से विचरण के विश्लेषण के परिणामों से मेल खाएंगे। हालाँकि, एनोवा में लचीली और शक्तिशाली तकनीकें शामिल हैं जिनका उपयोग अधिक जटिल अध्ययनों के लिए किया जा सकता है।

कई कारक।दुनिया प्रकृति में जटिल और बहुआयामी है। ऐसी स्थितियाँ जब एक निश्चित घटना को एक चर द्वारा पूरी तरह से वर्णित किया जाता है तो अत्यंत दुर्लभ होती हैं। उदाहरण के लिए, यदि हम यह सीखने की कोशिश कर रहे हैं कि बड़े टमाटर कैसे उगाए जाएं, तो हमें पौधे की आनुवंशिक संरचना, मिट्टी के प्रकार, प्रकाश, तापमान आदि से संबंधित कारकों पर विचार करना चाहिए। इस प्रकार, एक विशिष्ट प्रयोग करते समय, किसी को बड़ी संख्या में कारकों से निपटना पड़ता है। मुख्य कारण यह है कि विभिन्न कारक स्तरों पर दो नमूनों की बार-बार तुलना करने के बजाय एनोवा का उपयोग करना बेहतर है टी- मानदंड यह है कि विचरण का विश्लेषण अधिक है असरदारऔर, छोटे नमूनों के लिए, अधिक जानकारीपूर्ण।

कारक प्रबंधन.मान लीजिए कि ऊपर चर्चा किए गए दो-नमूना विश्लेषण उदाहरण में, हम एक और कारक जोड़ते हैं, उदाहरण के लिए ज़मीन- लिंग. माना कि प्रत्येक समूह में 3 पुरुष और 3 महिलाएँ हैं। इस प्रयोग का डिज़ाइन 2 बाय 2 तालिका के रूप में प्रस्तुत किया जा सकता है:

	प्रयोग। समूह 1	प्रयोग। समूह 2
पुरुषों	2	6
	3	7
	1	5
औसत	2	6
औरत	4	8
	5	9
	3	7
औसत	4	8

गणना करने से पहले, आप देख सकते हैं कि इस उदाहरण में कुल विचरण के कम से कम तीन स्रोत हैं:

(1) यादृच्छिक त्रुटि (समूह भिन्नता के भीतर),

(2) प्रायोगिक समूह सदस्यता से जुड़ी परिवर्तनशीलता, और

(3) अवलोकन की वस्तुओं के लिंग के कारण परिवर्तनशीलता।

(ध्यान दें कि परिवर्तनशीलता का एक और संभावित स्रोत है - कारकों की परस्पर क्रिया, जिस पर हम बाद में चर्चा करेंगे)। अगर हम शामिल नहीं करेंगे तो क्या होगा ज़मीन –लिंगविश्लेषण में एक कारक के रूप में और सामान्य गणना करें टी-मानदंड? यदि हम वर्गों के योग की गणना करते हैं, तो अनदेखा करें ज़मीन -लिंग(यानी, समूह के भीतर भिन्नता की गणना करते समय विभिन्न लिंगों की वस्तुओं को एक समूह में संयोजित करना, जिससे प्रत्येक समूह के लिए वर्गों का योग बराबर प्राप्त होता है) एसएस=10, और वर्गों का कुल योग एसएस= 10+10 = 20), तो हम उपसमूहों में अतिरिक्त विभाजन के साथ अधिक सटीक विश्लेषण की तुलना में इंट्राग्रुप विचरण का एक बड़ा मूल्य प्राप्त करते हैं। आधा- लिंग(इस मामले में, समूह के भीतर का मतलब 2 के बराबर होगा, और समूह के भीतर वर्गों का कुल योग बराबर होगा एसएस = 2+2+2+2 = 8). यह अंतर इस तथ्य के कारण है कि औसत मूल्य पुरुषों - पुरुषोंके औसत से कम औरत -महिला, और जब लिंग पर ध्यान नहीं दिया जाता है तो साधनों में यह अंतर समूह के भीतर समग्र परिवर्तनशीलता को बढ़ाता है। त्रुटि विचरण को नियंत्रित करने से परीक्षण की संवेदनशीलता (शक्ति) बढ़ जाती है।

यह उदाहरण पारंपरिक की तुलना में विचरण विश्लेषण का एक और लाभ दिखाता है टी- दो नमूनों के लिए मानदंड। विचरण का विश्लेषण आपको शेष कारकों के मूल्यों को नियंत्रित करके प्रत्येक कारक का अध्ययन करने की अनुमति देता है। वास्तव में, यह इसकी अधिक सांख्यिकीय शक्ति का मुख्य कारण है (सार्थक परिणाम प्राप्त करने के लिए छोटे नमूना आकार की आवश्यकता होती है)। इस कारण से, छोटे नमूनों पर भी भिन्नता का विश्लेषण, साधारण की तुलना में सांख्यिकीय रूप से अधिक महत्वपूर्ण परिणाम देता है टी- कसौटी.

इंटरेक्शन प्रभाव

पारंपरिक की तुलना में विचरण के विश्लेषण का उपयोग करने का एक और फायदा है टी- मानदंड: विचरण का विश्लेषण हमें पता लगाने की अनुमति देता है इंटरैक्शनकारकों के बीच और इसलिए अधिक जटिल मॉडल के अध्ययन की अनुमति देता है। स्पष्ट करने के लिए, एक और उदाहरण पर विचार करें।

मुख्य प्रभाव, जोड़ीवार (दो-कारक) अंतःक्रियाएँ।मान लीजिए कि छात्रों के दो समूह हैं, और मनोवैज्ञानिक रूप से पहले समूह के छात्र निर्धारित कार्यों को पूरा करने के लिए दृढ़ हैं और दूसरे समूह के छात्रों की तुलना में अधिक उद्देश्यपूर्ण हैं, जिसमें आलसी छात्र शामिल हैं। आइए प्रत्येक समूह को बेतरतीब ढंग से आधे में विभाजित करें और प्रत्येक समूह के एक आधे हिस्से को एक कठिन कार्य दें और दूसरे आधे को एक आसान कार्य दें। फिर हम मापेंगे कि छात्र इन कार्यों पर कितनी मेहनत करते हैं। इस (काल्पनिक) अध्ययन का औसत तालिका में दिखाया गया है:

इन परिणामों से क्या निष्कर्ष निकाला जा सकता है? क्या हम यह निष्कर्ष निकाल सकते हैं कि: (1) छात्र किसी जटिल कार्य पर अधिक तीव्रता से काम करते हैं; (2) क्या प्रेरित छात्र आलसी छात्रों की तुलना में अधिक मेहनत करते हैं? इनमें से कोई भी कथन तालिका में दिखाए गए साधनों की व्यवस्थित प्रकृति का सार नहीं दर्शाता है। परिणामों का विश्लेषण करते हुए यह कहना अधिक सही होगा कि केवल प्रेरित छात्र ही कठिन कार्यों पर अधिक मेहनत करते हैं, जबकि केवल आलसी छात्र ही आसान कार्यों पर अधिक मेहनत करते हैं। दूसरे शब्दों में, छात्रों का चरित्र और कार्य की कठिनाई बातचीतखर्च किए गए प्रयास पर एक दूसरे को प्रभावित करें। यह एक उदाहरण है जोड़ी बातचीतविद्यार्थियों के चरित्र और कार्य की कठिनाई के बीच। ध्यान दें कि कथन 1 और 2 वर्णन करते हैं मुख्य प्रभाव.

उच्च-क्रम की अंतःक्रियाएँ।जबकि जोड़ीदार अंतःक्रियाओं को समझाना अभी भी अपेक्षाकृत आसान है, उच्च-क्रम की अंतःक्रियाओं को समझाना अधिक कठिन है। आइए कल्पना करें कि ऊपर दिए गए उदाहरण में, एक और कारक पेश किया गया है ज़मीन -लिंगऔर हमें औसत की निम्नलिखित तालिका मिली:

अब प्राप्त परिणामों से क्या निष्कर्ष निकाला जा सकता है? माध्य कथानक जटिल प्रभावों की व्याख्या करना आसान बनाते हैं। एनोवा मॉड्यूल आपको माउस के लगभग एक क्लिक से ये ग्राफ़ बनाने की अनुमति देता है।

नीचे दिए गए ग्राफ़ में छवि अध्ययन किए जा रहे तीन-कारक इंटरैक्शन का प्रतिनिधित्व करती है।

ग्राफ़ को देखकर, हम बता सकते हैं कि महिलाओं के लिए व्यक्तित्व और परीक्षण की कठिनाई के बीच परस्पर क्रिया होती है: प्रेरित महिलाएं आसान काम की तुलना में कठिन काम पर अधिक मेहनत करती हैं। पुरुषों के लिए, वही अंतःक्रिया उलट जाती है। यह देखा जा सकता है कि कारकों के बीच परस्पर क्रिया का विवरण अधिक भ्रमित करने वाला हो जाता है।

इंटरैक्शन का वर्णन करने का एक सामान्य तरीका.सामान्य तौर पर, कारकों के बीच परस्पर क्रिया को एक प्रभाव में दूसरे के प्रभाव में परिवर्तन के रूप में वर्णित किया जाता है। ऊपर चर्चा किए गए उदाहरण में, दो-कारक बातचीत को छात्र के चरित्र का वर्णन करने वाले कारक के प्रभाव में कार्य की कठिनाई को दर्शाने वाले कारक के मुख्य प्रभाव में बदलाव के रूप में वर्णित किया जा सकता है। पिछले पैराग्राफ के तीन कारकों की परस्पर क्रिया के लिए, हम कह सकते हैं कि दो कारकों (कार्य की जटिलता और छात्र का चरित्र) की परस्पर क्रिया प्रभाव में बदल जाती है लिंग – लिंग. यदि चार कारकों की परस्पर क्रिया का अध्ययन किया जाए, तो हम कह सकते हैं कि तीनों कारकों की परस्पर क्रिया चौथे कारक के प्रभाव में बदल जाती है, अर्थात। चौथे कारक के विभिन्न स्तरों पर विभिन्न प्रकार की अंतःक्रियाएँ होती हैं। यह पता चला है कि कई क्षेत्रों में पांच या उससे भी अधिक कारकों की परस्पर क्रिया असामान्य नहीं है।

जटिल योजनाएँ

समूह के बीच और समूह के भीतर डिज़ाइन (बार-बार माप डिज़ाइन)

दो अलग-अलग समूहों की तुलना करते समय आमतौर पर इसका उपयोग किया जाता है टी- स्वतंत्र नमूनों के लिए मानदंड (मॉड्यूल से)। बुनियादी आँकड़े और तालिकाएँ). जब दो चरों की तुलना वस्तुओं (अवलोकनों) के एक ही सेट पर की जाती है, तो इसका उपयोग किया जाता है टी-आश्रित नमूनों के लिए मानदंड। विचरण के विश्लेषण के लिए यह भी महत्वपूर्ण है कि नमूने आश्रित हैं या नहीं। यदि एक ही चर के बार-बार माप होते हैं (विभिन्न परिस्थितियों में या अलग-अलग समय पर) समान वस्तुओं के लिए, फिर वे उपस्थिति के बारे में बात करते हैं बार-बार उपाय कारक(यह भी कहा जाता है इंट्राग्रुप फैक्टर,चूंकि वर्गों के भीतर-समूह योग की गणना इसके महत्व का आकलन करने के लिए की जाती है)। यदि वस्तुओं के विभिन्न समूहों की तुलना की जाती है (उदाहरण के लिए, पुरुष और महिलाएं, बैक्टीरिया के तीन उपभेद, आदि), तो समूहों के बीच अंतर का वर्णन किया गया है अंतरसमूह कारक.वर्णित दो प्रकार के कारकों के लिए महत्व मानदंड की गणना करने की विधियाँ अलग-अलग हैं, लेकिन उनके सामान्य तर्क और व्याख्याएँ समान हैं।

अंतर- और अंतर-समूह योजनाएँ।कई मामलों में, प्रयोग के लिए डिज़ाइन में विषयों के बीच के कारक और बार-बार माप के कारक दोनों को शामिल करने की आवश्यकता होती है। उदाहरण के लिए, महिला और पुरुष छात्रों के गणित कौशल को मापा जाता है (जहाँ ज़मीन -लिंग-इंटरग्रुप फ़ैक्टर) सेमेस्टर की शुरुआत और अंत में। प्रत्येक छात्र के कौशल के दो माप एक समूह-समूह कारक (बार-बार माप कारक) बनाते हैं। विषयों के बीच मुख्य प्रभावों और अंतःक्रियाओं की व्याख्या और बार-बार मापे जाने वाले कारकों की व्याख्या सुसंगत है, और दोनों प्रकार के कारक स्पष्ट रूप से एक-दूसरे के साथ बातचीत कर सकते हैं (उदाहरण के लिए, महिलाएं एक सेमेस्टर के दौरान कौशल हासिल करती हैं, जबकि पुरुष उन्हें खो देते हैं)।

अपूर्ण (नेस्टेड) योजनाएँ

कई मामलों में अंतःक्रिया प्रभाव को नजरअंदाज किया जा सकता है। यह या तो तब होता है जब यह ज्ञात होता है कि जनसंख्या में कोई अंतःक्रियात्मक प्रभाव नहीं है, या जब पूर्ण कार्यान्वयन होता है कारख़ाने कायोजना असंभव है. उदाहरण के लिए, ईंधन की खपत पर चार ईंधन योजकों के प्रभाव का अध्ययन किया जा रहा है। चार कारों और चार ड्राइवरों का चयन किया जाता है। भरा हुआ कारख़ाने काप्रयोग के लिए आवश्यक है कि प्रत्येक संयोजन: एडिटिव, ड्राइवर, कार - कम से कम एक बार दिखाई दे। इसके लिए कम से कम 4 x 4 x 4 = 64 समूहों के परीक्षणों की आवश्यकता होती है, जिसमें बहुत समय लगता है। इसके अतिरिक्त, ड्राइवर और ईंधन योज्य के बीच कोई बातचीत होने की संभावना नहीं है। इसे ध्यान में रखते हुए आप प्लान का इस्तेमाल कर सकते हैं लैटिन वर्ग,जिसमें केवल 16 परीक्षण समूह शामिल हैं (चार योजक ए, बी, सी और डी अक्षरों द्वारा निर्दिष्ट हैं):

प्रायोगिक डिज़ाइन पर अधिकांश पुस्तकों में लैटिन वर्गों का वर्णन किया गया है (उदाहरण के लिए, हेज़, 1988; लिंडमैन, 1974; मिलिकेन और जॉनसन, 1984; विनर, 1962) और यहां विस्तार से चर्चा नहीं की जाएगी। ध्यान दें कि लैटिन वर्ग हैं नहींएनभरा हुआऐसे डिज़ाइन जिनमें कारक स्तरों के सभी संयोजन शामिल नहीं हैं। उदाहरण के लिए, ड्राइवर 1 कार 1 को केवल एडिटिव ए के साथ चलाता है, ड्राइवर 3 कार 1 को केवल एडिटिव सी के साथ चलाता है। कारक स्तर योजक (ए, बी, सी और डी) तालिका कोशिकाओं में नेस्टेड हैं ऑटोमोबाइलएक्स चालक -घोंसले में अंडे की तरह. प्रकृति को समझने के लिए यह स्मृति उपयोगी है नेस्टेड या नेस्टेडयोजनाएं. मापांक भिन्नता का विश्लेषणइस प्रकार की योजनाओं का विश्लेषण करने के सरल तरीके प्रदान करता है।

सहप्रसरण विश्लेषण

मुख्य विचार

अध्याय में प्रमुख विचारकारक नियंत्रण का विचार और कैसे योगात्मक कारकों को शामिल करने से वर्ग त्रुटियों का योग कम हो जाता है और डिजाइन की सांख्यिकीय शक्ति बढ़ जाती है, इस पर संक्षेप में चर्चा की गई। यह सब मूल्यों के निरंतर सेट के साथ चर तक बढ़ाया जा सकता है। जब ऐसे निरंतर चर को किसी डिज़ाइन में कारकों के रूप में शामिल किया जाता है, तो उन्हें कहा जाता है सहसंयोजक.

निश्चित सहसंयोजक

मान लीजिए कि हम छात्रों के दो समूहों के गणित कौशल की तुलना कर रहे हैं जिन्हें दो अलग-अलग पाठ्यपुस्तकों का उपयोग करके पढ़ाया गया था। आइए यह भी मान लें कि प्रत्येक छात्र के लिए बुद्धिमत्ता भागफल (आईक्यू) डेटा उपलब्ध है। आप मान सकते हैं कि IQ गणित कौशल से संबंधित है और उस जानकारी का उपयोग करें। छात्रों के दो समूहों में से प्रत्येक के लिए, आईक्यू और गणित कौशल के बीच सहसंबंध गुणांक की गणना की जा सकती है। इस सहसंबंध गुणांक का उपयोग करके, समूहों में विचरण के अनुपात को अलग करना संभव है जिसे IQ के प्रभाव और विचरण के अस्पष्टीकृत अनुपात द्वारा समझाया गया है (यह भी देखें) सांख्यिकी की बुनियादी अवधारणाएँ(अध्याय 8) और बुनियादी आँकड़े और तालिकाएँ(अध्याय 9)). विचरण के शेष भाग का उपयोग विश्लेषण में त्रुटि विचरण के रूप में किया जाता है। यदि IQ और गणित कौशल के बीच सहसंबंध है, तो त्रुटि भिन्नता को काफी कम किया जा सकता है एसएस/(एन-1) .

सहसंयोजकों का प्रभावएफ- कसौटी. एफ-मानदंड समूहों में औसत मूल्यों में अंतर के सांख्यिकीय महत्व का मूल्यांकन करता है, और अंतरसमूह विचरण के अनुपात की गणना की जाती है ( एमएसप्रभाव) त्रुटि भिन्नता के लिए ( एमएसगलती) . अगर एमएसगलतीघट जाती है, उदाहरण के लिए, IQ कारक को ध्यान में रखते समय, मान एफबढ़ती है।

बहुत सारे सहसंयोजक.एकल सहसंयोजक (आईक्यू) के लिए ऊपर प्रयुक्त तर्क को आसानी से एकाधिक सहसंयोजकों तक बढ़ाया जा सकता है। उदाहरण के लिए, आईक्यू के अलावा, आप प्रेरणा, स्थानिक सोच आदि के माप को शामिल कर सकते हैं। सामान्य सहसंबंध गुणांक के बजाय, एकाधिक सहसंबंध गुणांक का उपयोग किया जाता है।

जब मूल्यएफ -मानदंड घट जाता है.कभी-कभी प्रायोगिक डिज़ाइन में सहसंयोजकों को शामिल करने से महत्व कम हो जाता है एफ-मानदंड . यह आमतौर पर इंगित करता है कि सहसंयोजक न केवल आश्रित चर (जैसे, गणित कौशल) के साथ, बल्कि कारकों (जैसे, विभिन्न पाठ्यपुस्तकों) के साथ भी सहसंबद्ध हैं। मान लीजिए कि दो अलग-अलग पाठ्यपुस्तकों का उपयोग करके छात्रों के दो समूहों को पढ़ाने के लगभग एक वर्ष के बाद, आईक्यू को सेमेस्टर के अंत में मापा जाता है। हालाँकि छात्रों को यादृच्छिक रूप से समूहों को सौंपा गया था, यह हो सकता है कि पाठ्यपुस्तक में अंतर इतना अधिक हो कि IQ और गणित कौशल दोनों समूहों के बीच बहुत भिन्न होंगे। इस मामले में, सहसंयोजक न केवल त्रुटि भिन्नता को कम करते हैं बल्कि समूह-समूह भिन्नता को भी कम करते हैं। दूसरे शब्दों में, समूहों में आईक्यू में अंतर को नियंत्रित करने के बाद, गणित कौशल में अंतर अब महत्वपूर्ण नहीं रह गया है। आप इसे अलग ढंग से कह सकते हैं. IQ के प्रभाव को "खारिज" करने के बाद, गणितीय कौशल के विकास पर पाठ्यपुस्तक के प्रभाव को अनजाने में बाहर कर दिया गया है।

समायोजित औसत.जब कोई सहसंयोजक विषयों के बीच के कारक को प्रभावित करता है, तो व्यक्ति को गणना करनी चाहिए समायोजित साधन, अर्थात। वे साधन जो सभी सहसंयोजक अनुमानों को हटाने के बाद प्राप्त किए जाते हैं।

सहसंयोजकों और कारकों के बीच परस्पर क्रिया।जिस तरह कारकों के बीच बातचीत की जांच की जाती है, उसी तरह सहसंयोजकों के बीच और कारकों के समूहों के बीच बातचीत की जांच की जा सकती है। मान लीजिए कि पाठ्यपुस्तकों में से एक विशेष रूप से स्मार्ट छात्रों के लिए उपयुक्त है। दूसरी पाठ्यपुस्तक होशियार छात्रों के लिए उबाऊ है, और वही पाठ्यपुस्तक कम होशियार छात्रों के लिए कठिन है। परिणामस्वरूप, पहले समूह में आईक्यू और सीखने के परिणाम के बीच एक सकारात्मक सहसंबंध है (होशियार छात्र, बेहतर परिणाम) और दूसरे समूह में शून्य या मामूली नकारात्मक सहसंबंध है (छात्र जितना होशियार होगा, उसके गणितीय कौशल हासिल करने की संभावना उतनी ही कम होगी) दूसरी पाठ्यपुस्तक से)। कुछ अध्ययन इस स्थिति पर सहप्रसरण विश्लेषण की मान्यताओं के उल्लंघन के उदाहरण के रूप में चर्चा करते हैं। हालाँकि, क्योंकि एनोवा मॉड्यूल सहप्रसरण के विश्लेषण के सबसे सामान्य तरीकों का उपयोग करता है, विशेष रूप से, कारकों और सहसंयोजकों के बीच बातचीत के सांख्यिकीय महत्व का मूल्यांकन करना संभव है।

परिवर्तनशील सहसंयोजक

जबकि निश्चित सहसंयोजकों की चर्चा पाठ्यपुस्तकों में अक्सर की जाती है, परिवर्तनीय सहसंयोजकों का उल्लेख बहुत कम बार किया जाता है। आमतौर पर, बार-बार माप के साथ प्रयोग करते समय, हम समय के विभिन्न बिंदुओं पर समान मात्रा के माप में अंतर में रुचि रखते हैं। अर्थात्, हम इन मतभेदों के महत्व में रुचि रखते हैं। यदि सहसंयोजकों को आश्रित चर के माप के साथ एक साथ मापा जाता है, तो सहसंयोजक और आश्रित चर के बीच सहसंबंध की गणना की जा सकती है।

उदाहरण के लिए, सेमेस्टर की शुरुआत और अंत में गणित की रुचि और गणित कौशल का पता लगाया जा सकता है। यह परीक्षण करना दिलचस्प होगा कि क्या गणित में रुचि में परिवर्तन गणित कौशल में परिवर्तन से संबंधित हैं।

मापांक भिन्नता का विश्लेषणवी सांख्यिकीजहां संभव हो, डिज़ाइन में सहसंयोजकों में परिवर्तन के सांख्यिकीय महत्व का स्वचालित रूप से आकलन करता है।

बहुभिन्नरूपी डिज़ाइन: विचरण और सहप्रसरण का बहुभिन्नरूपी विश्लेषण

अंतरसमूह योजनाएँ

पहले चर्चा किए गए सभी उदाहरणों में केवल एक आश्रित चर शामिल था। जब एक ही समय में कई आश्रित चर होते हैं, तो केवल गणना की जटिलता बढ़ जाती है, लेकिन सामग्री और बुनियादी सिद्धांत नहीं बदलते हैं।

उदाहरण के लिए, दो अलग-अलग पाठ्यपुस्तकों पर एक अध्ययन किया जाता है। साथ ही छात्रों की भौतिकी और गणित की पढ़ाई में सफलता का अध्ययन किया जाता है। इस मामले में, दो आश्रित चर हैं और आपको यह पता लगाना होगा कि दो अलग-अलग पाठ्यपुस्तकें उन्हें एक साथ कैसे प्रभावित करती हैं। ऐसा करने के लिए, आप विचरण के बहुभिन्नरूपी विश्लेषण (MANOVA) का उपयोग कर सकते हैं। एक-आयामी के बजाय एफकसौटी, बहुआयामी का प्रयोग किया जाता है एफपरीक्षण (विल्क्स एल परीक्षण), त्रुटि सहप्रसरण मैट्रिक्स और अंतरसमूह सहप्रसरण मैट्रिक्स की तुलना पर आधारित है।

यदि आश्रित चर एक-दूसरे के साथ सहसंबद्ध हैं, तो महत्व मानदंड की गणना करते समय इस सहसंबंध को ध्यान में रखा जाना चाहिए। जाहिर है, यदि एक ही माप दो बार दोहराया जाए, तो कुछ भी नया प्राप्त नहीं किया जा सकता है। यदि मौजूदा आयाम में एक सहसंबद्ध आयाम जोड़ा जाता है, तो कुछ नई जानकारी प्राप्त होती है, लेकिन नए चर में अनावश्यक जानकारी होती है, जो चर के बीच सहप्रसरण में परिलक्षित होती है।

परिणामों की व्याख्या।यदि समग्र बहुभिन्नरूपी परीक्षण महत्वपूर्ण है, तो हम यह निष्कर्ष निकाल सकते हैं कि संबंधित प्रभाव (जैसे, पाठ्यपुस्तक प्रकार) महत्वपूर्ण है। हालाँकि, निम्नलिखित प्रश्न उठते हैं। क्या पाठ्यपुस्तक का प्रकार केवल गणित कौशल, केवल शारीरिक कौशल या दोनों कौशल में सुधार को प्रभावित करता है? वास्तव में, एक महत्वपूर्ण बहुभिन्नरूपी परीक्षण प्राप्त करने के बाद, व्यक्तिगत मुख्य प्रभाव या अंतःक्रिया के लिए एक अविभाज्य परीक्षण की जांच की जाती है। एफकसौटी. दूसरे शब्दों में, बहुभिन्नरूपी परीक्षण के महत्व में योगदान देने वाले आश्रित चर की अलग से जांच की जाती है।

बार-बार माप डिजाइन

यदि छात्रों के गणित और भौतिकी कौशल को सेमेस्टर की शुरुआत और अंत में मापा जाता है, तो ये दोहराए गए उपाय हैं। ऐसी योजनाओं में महत्व मानदंड का अध्ययन एक-आयामी मामले का तार्किक विकास है। ध्यान दें कि विचरण तकनीकों के बहुभिन्नरूपी विश्लेषण का उपयोग आमतौर पर दो से अधिक स्तरों वाले अविभाज्य दोहराए गए माप कारकों के महत्व की जांच करने के लिए भी किया जाता है। संबंधित अनुप्रयोगों पर इस भाग में बाद में चर्चा की जाएगी।

परिवर्तनीय मानों का योग और विचरण का बहुभिन्नरूपी विश्लेषण

यहां तक कि विचरण के एकविभिन्न और बहुभिन्नरूपी विश्लेषण के अनुभवी उपयोगकर्ताओं को भी अक्सर विचरण के बहुभिन्नरूपी विश्लेषण को लागू करते समय अलग-अलग परिणाम प्राप्त करना मुश्किल लगता है, उदाहरण के लिए, तीन चर के लिए, और जब इन तीन चर के योग पर विचरण के एकविभिन्न विश्लेषण को लागू करते हैं, जैसे कि यह एक एकल चर थे.

विचार योगचर का अर्थ यह है कि प्रत्येक चर में कुछ वास्तविक चर होते हैं, जिनका अध्ययन किया जा रहा है, साथ ही एक यादृच्छिक माप त्रुटि भी होती है। इसलिए, चर के मानों का औसत निकालते समय, माप त्रुटि सभी मापों के लिए 0 के करीब होगी और औसत मान अधिक विश्वसनीय होंगे। वास्तव में, इस मामले में, चरों के योग पर एनोवा लागू करना उचित और एक शक्तिशाली तकनीक है। हालाँकि, यदि आश्रित चर प्रकृति में बहुआयामी हैं, तो चर के मूल्यों का योग अनुचित है।

उदाहरण के लिए, मान लें कि आश्रित चर में चार संकेतक शामिल हैं समाज में सफलता. प्रत्येक संकेतक मानव गतिविधि के एक पूरी तरह से स्वतंत्र पहलू की विशेषता बताता है (उदाहरण के लिए, व्यावसायिक सफलता, व्यवसाय में सफलता, पारिवारिक कल्याण, आदि)। इन चरों को जोड़ना सेब और संतरे को जोड़ने जैसा है। इन चरों का योग एक उपयुक्त एकआयामी माप नहीं होगा। इसलिए, ऐसे डेटा को बहुआयामी संकेतक के रूप में माना जाना चाहिए विचरण का बहुभिन्नरूपी विश्लेषण.

कंट्रास्ट विश्लेषण और पोस्ट हॉक परीक्षण

औसत के अलग-अलग सेटों की तुलना क्यों की जाती है?

आमतौर पर, प्रयोगात्मक डेटा के बारे में परिकल्पनाएं केवल मुख्य प्रभावों या इंटरैक्शन के संदर्भ में नहीं बनाई जाती हैं। एक उदाहरण यह परिकल्पना होगी: एक निश्चित पाठ्यपुस्तक केवल पुरुष छात्रों में गणित कौशल में सुधार करती है, जबकि एक अन्य पाठ्यपुस्तक दोनों लिंगों के लिए लगभग समान रूप से प्रभावी है, लेकिन पुरुषों के लिए अभी भी कम प्रभावी है। यह अनुमान लगाया जा सकता है कि पाठ्यपुस्तक की प्रभावशीलता छात्र लिंग के साथ परस्पर क्रिया करती है। हालाँकि, यह पूर्वानुमान भी लागू होता है प्रकृतिइंटरैक्शन. एक पुस्तक का उपयोग करने वाले छात्रों के लिए लिंग के बीच एक महत्वपूर्ण अंतर अपेक्षित है और दूसरी पुस्तक का उपयोग करने वाले छात्रों के लिए लिंग के आधार पर वस्तुतः स्वतंत्र परिणाम अपेक्षित हैं। इस प्रकार की परिकल्पना की जांच आमतौर पर कंट्रास्ट विश्लेषण का उपयोग करके की जाती है।

विरोधाभासों का विश्लेषण

संक्षेप में, कंट्रास्ट विश्लेषण किसी को जटिल प्रभावों के कुछ रैखिक संयोजनों के सांख्यिकीय महत्व का मूल्यांकन करने की अनुमति देता है। कंट्रास्ट विश्लेषण किसी भी जटिल एनोवा योजना का मुख्य और अनिवार्य तत्व है। मापांक भिन्नता का विश्लेषणइसमें विभिन्न प्रकार की कंट्रास्ट विश्लेषण क्षमताएं हैं जो आपको किसी भी प्रकार की तुलना के साधनों को अलग करने और उनका विश्लेषण करने की अनुमति देती हैं।

वापसतुलना

कभी-कभी, किसी प्रयोग को संसाधित करने के परिणामस्वरूप, एक अप्रत्याशित प्रभाव की खोज की जाती है। हालांकि ज्यादातर मामलों में एक रचनात्मक शोधकर्ता किसी भी परिणाम की व्याख्या करने में सक्षम होगा, लेकिन यह भविष्यवाणी के लिए आगे के विश्लेषण और अनुमान की अनुमति नहीं देता है। यह समस्या उनमें से एक है एक पश्च मानदंड, अर्थात्, मानदंड जो उपयोग नहीं करते हैं संभवतःपरिकल्पनाएँ स्पष्ट करने के लिए, निम्नलिखित प्रयोग पर विचार करें। आइए मान लें कि 100 कार्ड हैं जिनमें 1 से 10 तक संख्याएं हैं। इन सभी कार्डों को एक टोपी में रखकर, हम यादृच्छिक रूप से 20 बार 5 कार्डों का चयन करते हैं, और प्रत्येक नमूने के लिए औसत मूल्य (कार्ड पर लिखी संख्याओं का औसत) की गणना करते हैं। क्या आप उम्मीद कर सकते हैं कि दो नमूने ऐसे होंगे जिनके साधन काफी भिन्न होंगे? यह बहुत प्रशंसनीय है! अधिकतम और न्यूनतम माध्य वाले दो नमूनों का चयन करके, आप साधनों में अंतर प्राप्त कर सकते हैं जो कि साधनों में अंतर से बहुत अलग है, उदाहरण के लिए, पहले दो नमूनों में। उदाहरण के लिए, कंट्रास्ट विश्लेषण का उपयोग करके इस अंतर का पता लगाया जा सकता है। विवरण में जाए बिना, कई तथाकथित हैं वापसमानदंड जो बिल्कुल पहले परिदृश्य पर आधारित हैं (20 नमूनों से चरम साधन लेते हुए), यानी ये मानदंड डिजाइन में सभी साधनों की तुलना करने के लिए सबसे अलग साधन चुनने पर आधारित हैं। इन मानदंडों का उपयोग यह सुनिश्चित करने के लिए किया जाता है कि कोई कृत्रिम प्रभाव पूरी तरह से संयोग से प्राप्त नहीं होता है, उदाहरण के लिए, जब कोई साधन न हो तो उनके बीच महत्वपूर्ण अंतर का पता लगाना। मापांक भिन्नता का विश्लेषणऐसे मानदंडों की एक विस्तृत श्रृंखला प्रदान करता है। जब कई समूहों से जुड़े किसी प्रयोग में अप्रत्याशित परिणाम सामने आते हैं वापसप्राप्त परिणामों के सांख्यिकीय महत्व की जांच के लिए प्रक्रियाएं।

I, II, III और IV प्रकार के वर्गों का योग

बहुभिन्नरूपी प्रतिगमन और विचरण का विश्लेषण

बहुभिन्नरूपी प्रतिगमन विधि और विचरण के विश्लेषण (विचरण का विश्लेषण) के बीच घनिष्ठ संबंध है। दोनों विधियों में एक रैखिक मॉडल का अध्ययन किया जाता है। संक्षेप में, लगभग सभी प्रायोगिक डिज़ाइनों की जांच बहुभिन्नरूपी प्रतिगमन का उपयोग करके की जा सकती है। निम्नलिखित सरल अंतरसमूह 2 x 2 डिज़ाइन पर विचार करें।

डी.वी.	ए	बी	एक्सबी
3	1	1	1
4	1	1	1
4	1	-1	-1
5	1	-1	-1
6	-1	1	-1
6	-1	1	-1
3	-1	-1	1
2	-1	-1	1

कॉलम ए और बी में कारक ए और बी के स्तर को दर्शाने वाले कोड होते हैं, कॉलम एक्सबी में दो कॉलम ए और बी का उत्पाद होता है। हम बहुभिन्नरूपी प्रतिगमन का उपयोग करके इस डेटा का विश्लेषण कर सकते हैं। चर डी.वी.एक आश्रित चर के रूप में परिभाषित, से चर एपहले एक्सबीस्वतंत्र चर के रूप में। प्रतिगमन गुणांक के महत्व का अध्ययन कारकों के मुख्य प्रभावों के महत्व के विचरण के विश्लेषण में गणना के साथ मेल खाएगा एऔर बीऔर अंतःक्रिया प्रभाव एक्सबी.

असंतुलित एवं संतुलित योजनाएँ

सभी चरों के लिए सहसंबंध मैट्रिक्स की गणना करते समय, जैसे कि ऊपर दर्शाया गया डेटा, आप देखेंगे कि कारकों का मुख्य प्रभाव एऔर बीऔर अंतःक्रिया प्रभाव एक्सबीअसंबंधित. प्रभावों के इस गुण को ऑर्थोगोनैलिटी भी कहा जाता है। वे प्रभाव कहते हैं एऔर बी - ओर्थोगोनलया स्वतंत्रएक दूसरे से। यदि किसी योजना में सभी प्रभाव एक-दूसरे के लिए ऑर्थोगोनल हैं, जैसा कि ऊपर दिए गए उदाहरण में है, तो योजना को कहा जाता है बैलेंस्ड.

संतुलित योजनाओं में "अच्छी संपत्ति" होती है। ऐसी योजनाओं के विश्लेषण की गणना बहुत सरल है। सभी गणनाएँ प्रभावों और आश्रित चरों के बीच सहसंबंध की गणना करने तक सीमित हैं। चूँकि प्रभाव ऑर्थोगोनल हैं, आंशिक सहसंबंध (पूर्ण रूप में)। बहुआयामीप्रतिगमन) की गणना नहीं की जाती है। हालाँकि, वास्तविक जीवन में योजनाएँ हमेशा संतुलित नहीं होती हैं।

आइए कोशिकाओं में असमान संख्या में अवलोकनों के साथ वास्तविक डेटा पर विचार करें।

फैक्टर ए	कारक बी
फैक्टर ए	बी 1	बी2
ए 1	3	4, 5
ए2	6, 6, 7	2

यदि हम इस डेटा को ऊपर बताए अनुसार कोड करते हैं और सभी चर के लिए सहसंबंध मैट्रिक्स की गणना करते हैं, तो हम पाते हैं कि डिज़ाइन कारक एक दूसरे के साथ सहसंबद्ध हैं। किसी योजना में कारक अब ओर्थोगोनल नहीं रह जाते हैं और ऐसी योजनाएँ कहलाती हैं असंतुलित.ध्यान दें कि विचाराधीन उदाहरण में, कारकों के बीच सहसंबंध पूरी तरह से डेटा मैट्रिक्स के कॉलम में 1 और -1 की आवृत्तियों में अंतर के कारण है। दूसरे शब्दों में, असमान सेल वॉल्यूम (अधिक सटीक रूप से, अनुपातहीन वॉल्यूम) वाले प्रयोगात्मक डिज़ाइन असंतुलित होंगे, जिसका अर्थ है कि मुख्य प्रभाव और इंटरैक्शन भ्रमित हो जाएंगे। इस मामले में, प्रभावों के सांख्यिकीय महत्व की गणना करने के लिए पूर्ण बहुभिन्नरूपी प्रतिगमन की गणना की जानी चाहिए। यहां कई रणनीतियां हैं.

I, II, III और IV प्रकार के वर्गों का योग

वर्गों का योग प्रकारमैंऔरतृतीय. बहुभिन्नरूपी मॉडल में प्रत्येक कारक के महत्व की जांच करने के लिए, प्रत्येक कारक के आंशिक सहसंबंध की गणना की जा सकती है, बशर्ते कि मॉडल में अन्य सभी कारकों का पहले से ही हिसाब हो। आप चरण-दर-चरण तरीके से मॉडल में कारकों को भी दर्ज कर सकते हैं, मॉडल में पहले से दर्ज सभी कारकों को कैप्चर कर सकते हैं और अन्य सभी कारकों को अनदेखा कर सकते हैं। सामान्य तौर पर, यही अंतर है प्रकार तृतीयऔर प्रकारमैंवर्गों का योग (यह शब्दावली एसएएस में पेश की गई थी, उदाहरण के लिए, एसएएस, 1982 देखें; विस्तृत चर्चा सियरल, 1987, पृष्ठ 461; वुडवर्ड, बोनेट, और ब्रेख्त, 1990, पृष्ठ 216; या मिलिकेन में भी पाई जा सकती है। और जॉनसन, 1984, पृष्ठ 138)।

वर्गों का योग प्रकारद्वितीय.अगली "मध्यवर्ती" मॉडल निर्माण रणनीति में शामिल हैं: एकल मुख्य प्रभाव के महत्व की जांच करते समय सभी मुख्य प्रभावों को नियंत्रित करना; व्यक्तिगत जोड़ीवार अंतःक्रिया के महत्व की जांच करते समय सभी मुख्य प्रभावों और सभी जोड़ीवार अंतःक्रियाओं को नियंत्रित करने में; सभी जोड़ीदार अंतःक्रियाओं और तीन कारकों की सभी अंतःक्रियाओं के सभी मुख्य प्रभावों को नियंत्रित करने में; तीन कारकों आदि की व्यक्तिगत अंतःक्रिया का अध्ययन करते समय। इस प्रकार परिकलित प्रभावों के वर्गों के योग को कहा जाता है प्रकारद्वितीयवर्गों का योग। इसलिए, प्रकारद्वितीयवर्गों का योग समान क्रम और निचले क्रम के सभी प्रभावों को नियंत्रित करता है, जबकि सभी उच्च क्रम के प्रभावों को अनदेखा करता है।

वर्गों का योग प्रकारचतुर्थ. अंत में, लुप्त कोशिकाओं (अधूरी योजनाओं) वाली कुछ विशेष योजनाओं के लिए, तथाकथित की गणना करना संभव है प्रकार चतुर्थवर्गों का योग। अपूर्ण डिज़ाइन (लापता कोशिकाओं वाले डिज़ाइन) के संबंध में इस पद्धति पर बाद में चर्चा की जाएगी।

प्रकार I, II और III के वर्गों की परिकल्पना के योग की व्याख्या

वर्गों का योग प्रकारतृतीयव्याख्या करना सबसे आसान. याद रखें कि वर्गों का योग प्रकारतृतीयअन्य सभी प्रभावों को नियंत्रित करने के बाद प्रभावों की जाँच करें। उदाहरण के लिए, सांख्यिकीय रूप से महत्वपूर्ण खोजने के बाद प्रकारतृतीयकारक के लिए प्रभाव एमॉड्यूल में भिन्नता का विश्लेषण, हम कह सकते हैं कि कारक का एक ही महत्वपूर्ण प्रभाव है ए, अन्य सभी प्रभावों (कारकों) का परिचय देने के बाद और तदनुसार इस प्रभाव की व्याख्या करें। संभवतः सभी एनोवा अनुप्रयोगों में से 99% में, यह उस प्रकार का परीक्षण है जिसमें शोधकर्ता की रुचि होती है। इस प्रकार के वर्गों के योग की गणना आमतौर पर मॉड्यूलो में की जाती है भिन्नता का विश्लेषणडिफ़ॉल्ट रूप से, चाहे विकल्प चुना गया हो प्रतिगमन दृष्टिकोणया नहीं (मॉड्यूल में अपनाए गए मानक दृष्टिकोण भिन्नता का विश्लेषणनीचे वर्णित)।

वर्गों के योग का उपयोग करके प्राप्त महत्वपूर्ण प्रभाव प्रकारया प्रकारद्वितीयवर्गों के योग की व्याख्या करना इतना आसान नहीं है। उनकी सबसे अच्छी व्याख्या चरणबद्ध बहुभिन्नरूपी प्रतिगमन के संदर्भ में की जाती है। यदि, वर्गों के योग का उपयोग करते समय प्रकारमैंकारक बी का मुख्य प्रभाव महत्वपूर्ण था (कारक ए को मॉडल में शामिल करने के बाद, लेकिन ए और बी के बीच बातचीत को जोड़ने से पहले), हम यह निष्कर्ष निकाल सकते हैं कि कारक बी का एक महत्वपूर्ण मुख्य प्रभाव है, बशर्ते कि कोई बातचीत न हो कारक ए और बी के बीच (यदि मानदंड का उपयोग कर रहे हैं प्रकारतृतीय, कारक बी भी महत्वपूर्ण निकला, तो हम यह निष्कर्ष निकाल सकते हैं कि मॉडल में अन्य सभी कारकों और उनकी अंतःक्रियाओं को पेश करने के बाद कारक बी का एक महत्वपूर्ण मुख्य प्रभाव है)।

सीमांत साधन परिकल्पना के संदर्भ में प्रकारमैंऔर प्रकारद्वितीयआमतौर पर इसकी कोई सरल व्याख्या नहीं होती। इन मामलों में, यह कहा जाता है कि कोई केवल सीमांत साधनों को देखकर प्रभावों के महत्व की व्याख्या नहीं कर सकता है। बल्कि प्रस्तुत किया गया पीसाधन एक जटिल परिकल्पना से संबंधित हैं जो साधन और नमूना आकार को जोड़ती है। उदाहरण के लिए, प्रकारद्वितीयपहले चर्चा की गई 2 x 2 डिज़ाइन के सरल उदाहरण में कारक ए के लिए परिकल्पनाएँ होंगी (वुडवर्ड, बोनेट और ब्रेख्त, 1990, पृष्ठ 219 देखें):

निज- सेल में अवलोकनों की संख्या

उइज- सेल में औसत मान

एन. जे- सीमांत औसत

बहुत अधिक विवरण में जाए बिना (अधिक विवरण के लिए, मिलिकेन और जॉनसन, 1984, अध्याय 10 देखें), यह स्पष्ट है कि ये सरल परिकल्पनाएं नहीं हैं और ज्यादातर मामलों में इनमें से कोई भी शोधकर्ता के लिए विशेष रुचि का नहीं है। हालाँकि, ऐसे मामले भी हैं जब परिकल्पनाएँ प्रकारमैंदिलचस्प हो सकता है.

मॉड्यूल में डिफ़ॉल्ट कम्प्यूटेशनल दृष्टिकोण भिन्नता का विश्लेषण

यदि विकल्प की जाँच नहीं की गई है तो डिफ़ॉल्ट प्रतिगमन दृष्टिकोण, मापांक भिन्नता का विश्लेषणउपयोग सेल औसत मॉडल. इस मॉडल की विशेषता यह है कि विभिन्न प्रभावों के लिए वर्गों के योग की गणना सेल साधनों के रैखिक संयोजनों के लिए की जाती है। एक पूर्ण फैक्टोरियल प्रयोग में, इसका परिणाम वर्गों का योग होता है जो पहले चर्चा किए गए वर्गों के योग के समान होता है प्रकार तृतीय. हालाँकि, विकल्प में नियोजित तुलना(खिड़की में एनोवा परिणाम), उपयोगकर्ता भारित या अभारित सेल साधनों के किसी भी रैखिक संयोजन के विरुद्ध एक परिकल्पना का परीक्षण कर सकता है। इस प्रकार, उपयोगकर्ता न केवल परिकल्पनाओं का परीक्षण कर सकता है प्रकारतृतीय, लेकिन किसी भी प्रकार की परिकल्पना (सहित) प्रकारचतुर्थ). यह सामान्य दृष्टिकोण विशेष रूप से तब उपयोगी होता है जब गायब कोशिकाओं (अपूर्ण डिजाइन कहा जाता है) वाले डिजाइनों की जांच की जाती है।

पूर्ण फैक्टोरियल डिज़ाइन के लिए, यह दृष्टिकोण तब भी उपयोगी होता है जब कोई भारित सीमांत साधनों का विश्लेषण करना चाहता है। उदाहरण के लिए, मान लीजिए कि पहले विचार किए गए सरल 2 x 2 डिज़ाइन में, हमें भारित (कारक स्तरों द्वारा) की तुलना करने की आवश्यकता है बी) कारक ए के लिए सीमांत साधन। यह तब उपयोगी होता है जब कोशिकाओं में अवलोकनों का वितरण प्रयोगकर्ता द्वारा तैयार नहीं किया गया था, बल्कि यादृच्छिक रूप से बनाया गया था, और यह यादृच्छिकता कारक बी के स्तरों में अवलोकनों की संख्या के वितरण में परिलक्षित होती है। सकल।

उदाहरण के लिए, एक कारक है - विधवाओं की उम्र। उत्तरदाताओं के संभावित नमूने को दो समूहों में विभाजित किया गया है: 40 वर्ष से कम आयु और 40 वर्ष से अधिक (कारक बी)। योजना में दूसरा कारक (फैक्टर ए) यह था कि विधवाओं को किसी एजेंसी से सामाजिक समर्थन मिला या नहीं (कुछ विधवाओं को यादृच्छिक रूप से चुना गया था, अन्य को नियंत्रण के रूप में कार्य किया गया था)। इस मामले में, नमूने में उम्र के अनुसार विधवाओं का वितरण जनसंख्या में उम्र के अनुसार विधवाओं के वास्तविक वितरण को दर्शाता है। विधवाओं के लिए सामाजिक सहायता समूह की प्रभावशीलता का आकलन करना सभी उम्रदो आयु समूहों के लिए भारित औसत के अनुरूप होगा (समूह में टिप्पणियों की संख्या के अनुरूप भार के साथ)।

नियोजित तुलना

ध्यान दें कि प्रविष्ट कंट्रास्ट गुणांकों का योग आवश्यक रूप से 0 (शून्य) के बराबर नहीं है। इसके बजाय, प्रोग्राम यह सुनिश्चित करने के लिए स्वचालित रूप से समायोजन करेगा कि संबंधित परिकल्पनाएं समग्र औसत के साथ भ्रमित न हों।

इसे स्पष्ट करने के लिए, आइए पहले चर्चा की गई सरल 2 x 2 योजना पर वापस जाएँ। याद रखें कि इस असंतुलित डिज़ाइन की कोशिकाओं में अवलोकनों की संख्या -1, 2, 3, और 1 है। मान लीजिए कि हम कारक ए के लिए भारित सीमांत साधनों की तुलना करना चाहते हैं (कारक बी के स्तरों की आवृत्ति द्वारा भारित)। आप कंट्रास्ट गुणांक दर्ज कर सकते हैं:

ध्यान दें कि इन गुणांकों का योग 0 तक नहीं होता है। प्रोग्राम गुणांकों को सेट करेगा ताकि उनका योग 0 हो, और उनके सापेक्ष मान संरक्षित रहेंगे, अर्थात:

1/3 2/3 -3/4 -1/4

ये विरोधाभास फैक्टर ए के लिए भारित साधनों की तुलना करेंगे।

प्रमुख औसत के बारे में परिकल्पनाएँ।यह परिकल्पना कि अभारित मुख्य माध्य 0 है, गुणांकों का उपयोग करके पता लगाया जा सकता है:

इस परिकल्पना का परीक्षण किया जाता है कि भारित मुख्य माध्य 0 है:

किसी भी स्थिति में प्रोग्राम कंट्रास्ट अनुपात को समायोजित नहीं करता है।

लुप्त कोशिकाओं वाली योजनाओं का विश्लेषण (अधूरी योजनाएँ)

फैक्टोरियल डिज़ाइन जिनमें खाली कोशिकाएँ होती हैं (कोशिकाओं के प्रसंस्करण संयोजन जिनमें कोई अवलोकन नहीं होता है) अपूर्ण कहलाते हैं। ऐसे डिज़ाइनों में, कुछ कारक आमतौर पर ऑर्थोगोनल नहीं होते हैं और कुछ इंटरैक्शन की गणना नहीं की जा सकती है। ऐसी योजनाओं के विश्लेषण के लिए आमतौर पर कोई बेहतर तरीका नहीं है।

प्रतिगमन दृष्टिकोण

कुछ पुराने कार्यक्रमों में जो बहुभिन्नरूपी प्रतिगमन का उपयोग करके एनोवा डिज़ाइनों का विश्लेषण करने पर भरोसा करते हैं, अपूर्ण डिज़ाइनों में कारक हमेशा की तरह डिफ़ॉल्ट रूप से निर्दिष्ट होते हैं (जैसे कि डिज़ाइन पूर्ण थे)। फिर इन डमी-कोडित कारकों पर बहुभिन्नरूपी प्रतिगमन विश्लेषण किया जाता है। दुर्भाग्य से, यह विधि ऐसे परिणाम उत्पन्न करती है जिनकी व्याख्या करना असंभव नहीं तो बहुत कठिन है क्योंकि यह स्पष्ट नहीं है कि प्रत्येक प्रभाव साधनों के रैखिक संयोजन में कैसे योगदान देता है। निम्नलिखित सरल उदाहरण पर विचार करें.

फैक्टर ए	कारक बी
फैक्टर ए	बी 1	बी2
ए 1	3	4, 5
ए2	6, 6, 7	चुक होना

यदि हम प्रपत्र का बहुभिन्नरूपी प्रतिगमन करते हैं आश्रित चर = स्थिरांक + गुणनखंड A + गुणनखंड B, तो साधनों के रैखिक संयोजनों के संदर्भ में कारक ए और बी के महत्व के बारे में परिकल्पना इस तरह दिखती है:

कारक ए: सेल ए1,बी1 = सेल ए2,बी1

कारक बी: सेल ए1,बी1 = सेल ए1,बी2

यह मामला सरल है. अधिक जटिल डिज़ाइनों में, वास्तव में यह निर्धारित करना असंभव है कि वास्तव में किसकी जांच की जाएगी।

सेल का अर्थ है, एनोवा दृष्टिकोण , टाइप IV परिकल्पनाएँ

साहित्य में जिस दृष्टिकोण की अनुशंसा की जाती है और जो बेहतर लगता है वह है सार्थक अध्ययन करना (शोध प्रश्नों के संदर्भ में) संभवतःयोजना की कोशिकाओं में देखे गए साधनों के बारे में परिकल्पनाएँ। इस दृष्टिकोण की विस्तृत चर्चा डॉज (1985), हेइबर्गर (1989), मिलिकेन और जॉनसन (1984), सियरल (1987), या वुडवर्ड, बोनेट और ब्रेख्त (1990) में पाई जा सकती है। अपूर्ण डिज़ाइनों में साधनों के रैखिक संयोजन के बारे में परिकल्पनाओं से जुड़े वर्गों के योग जो प्रभावों के भाग के अनुमानों की जांच करते हैं उन्हें वर्गों का योग भी कहा जाता है चतुर्थ.

प्रकार की परिकल्पनाओं का स्वचालित निर्माणचतुर्थ. जब बहुभिन्नरूपी डिज़ाइन में जटिल लापता सेल पैटर्न होते हैं, तो ऑर्थोगोनल (स्वतंत्र) परिकल्पनाओं को परिभाषित करना वांछनीय होता है जिनकी जांच मुख्य प्रभावों या इंटरैक्शन की जांच के बराबर होती है। ऐसी तुलनाओं के लिए उपयुक्त वजन उत्पन्न करने के लिए एल्गोरिदमिक (कम्प्यूटेशनल) रणनीतियाँ (छद्म-उलटा डिज़ाइन मैट्रिक्स पर आधारित) विकसित की गई हैं। दुर्भाग्य से, अंतिम परिकल्पनाओं को अनोखे तरीके से परिभाषित नहीं किया गया है। बेशक, वे उस क्रम पर निर्भर करते हैं जिसमें प्रभावों की पहचान की गई थी और शायद ही कभी एक सरल व्याख्या की अनुमति मिलती है। इसलिए, लापता कोशिकाओं की प्रकृति का सावधानीपूर्वक अध्ययन करने, फिर परिकल्पना तैयार करने की सिफारिश की जाती है प्रकारचतुर्थ, जो अध्ययन के उद्देश्यों से सर्वाधिक सार्थक रूप से मेल खाता है। फिर विकल्प का उपयोग करके इन परिकल्पनाओं का पता लगाएं नियोजित तुलनाखिड़की में परिणाम. इस मामले में तुलना निर्दिष्ट करने का सबसे आसान तरीका सभी कारकों के लिए विरोधाभासों के एक वेक्टर की शुरूआत की आवश्यकता है एक साथखिड़की में नियोजित तुलना.डायलॉग बॉक्स को कॉल करने के बाद नियोजित तुलनामौजूदा योजना के सभी समूह दिखाए जाएंगे और जो छूट गए हैं उन्हें चिह्नित किया जाएगा।

गुम कोशिकाएं और विशिष्ट प्रभाव के लिए परीक्षण

ऐसे कई प्रकार के डिज़ाइन हैं जिनमें गायब कोशिकाओं का स्थान यादृच्छिक नहीं है, बल्कि सावधानीपूर्वक योजनाबद्ध है, जिससे अन्य प्रभावों को प्रभावित किए बिना मुख्य प्रभावों का सरल विश्लेषण किया जा सकता है। उदाहरण के लिए, जब किसी योजना में आवश्यक संख्या में सेल उपलब्ध नहीं होते हैं, तो अक्सर योजनाओं का उपयोग किया जाता है लैटिन वर्गबड़ी संख्या में स्तरों के साथ कई कारकों के मुख्य प्रभावों का अनुमान लगाना। उदाहरण के लिए, 4 x 4 x 4 x 4 फैक्टोरियल डिज़ाइन के लिए 256 कोशिकाओं की आवश्यकता होती है। उसी समय आप उपयोग कर सकते हैं ग्रीको-लैटिन वर्गडिज़ाइन में केवल 16 कोशिकाओं के साथ मुख्य प्रभावों का अनुमान लगाने के लिए (अध्याय)। प्रयोग योजना, खंड IV में ऐसी योजनाओं का विस्तृत विवरण शामिल है)। अपूर्ण डिज़ाइन जिसमें मुख्य प्रभावों (और कुछ इंटरैक्शन) का अनुमान साधनों के सरल रैखिक संयोजनों का उपयोग करके लगाया जा सकता है, कहलाते हैं संतुलित अधूरी योजनाएँ.

संतुलित डिज़ाइन में, मुख्य प्रभावों और अंतःक्रियाओं के लिए विरोधाभास (वजन) उत्पन्न करने की मानक (डिफ़ॉल्ट) विधि तब भिन्नता विश्लेषण की एक तालिका तैयार करेगी जिसमें संबंधित प्रभावों के लिए वर्गों का योग एक दूसरे के साथ भ्रमित नहीं होता है। विकल्प विशिष्ट प्रभावखिड़की परिणामलुप्त योजना कोशिकाओं पर शून्य लिखकर लुप्त विरोधाभास उत्पन्न करेगा। विकल्प के अनुरोध के तुरंत बाद विशिष्ट प्रभावकुछ परिकल्पनाओं की जांच करने वाले उपयोगकर्ता के लिए, वास्तविक भार के साथ परिणामों की एक तालिका दिखाई देती है। ध्यान दें कि एक संतुलित डिज़ाइन में, संबंधित प्रभावों के वर्गों के योग की गणना केवल तभी की जाती है जब वे प्रभाव अन्य सभी मुख्य प्रभावों और इंटरैक्शन के लिए ऑर्थोगोनल (स्वतंत्र) होते हैं। अन्यथा, आपको विकल्प का उपयोग करना होगा नियोजित तुलनासाधनों के बीच सार्थक तुलनाओं का पता लगाना।

गुम कोशिकाएं और एकत्रित प्रभाव/त्रुटि शर्तें

यदि विकल्प प्रतिगमन दृष्टिकोणमॉड्यूल प्रारंभ पैनल में भिन्नता का विश्लेषणचयनित नहीं है, सेल औसत मॉडल का उपयोग प्रभावों के लिए वर्गों के योग की गणना करते समय किया जाएगा (डिफ़ॉल्ट सेटिंग)। यदि डिज़ाइन संतुलित नहीं है, तो गैर-ऑर्थोगोनल प्रभावों का संयोजन करते समय (विकल्प की उपरोक्त चर्चा देखें छूटी हुई कोशिकाएँ और विशिष्ट प्रभाव) कोई गैर-ऑर्थोगोनल (या ओवरलैपिंग) घटकों से युक्त वर्गों का योग प्राप्त कर सकता है। प्राप्त परिणाम आमतौर पर व्याख्या योग्य नहीं होते हैं। इसलिए, जटिल अपूर्ण प्रयोगात्मक डिज़ाइनों का चयन और कार्यान्वयन करते समय किसी को बहुत सावधान रहना चाहिए।

विभिन्न प्रकार की योजनाओं की विस्तृत चर्चा वाली अनेक पुस्तकें हैं। (डॉज, 1985; हेइबर्गर, 1989; लिंडमैन, 1974; मिलिकेन और जॉनसन, 1984; सियरल, 1987; वुडवर्ड और बोनेट, 1990), लेकिन इस प्रकार की जानकारी इस पाठ्यपुस्तक के दायरे से बाहर है। हालाँकि, विभिन्न प्रकार की योजनाओं का विश्लेषण इस खंड में बाद में प्रदर्शित किया जाएगा।

धारणाएँ और धारणाओं का उल्लंघन करने के प्रभाव

सामान्य वितरण की धारणा से विचलन

मान लीजिए आश्रित चर को संख्यात्मक पैमाने पर मापा जाता है। आइए हम यह भी मान लें कि आश्रित चर सामान्य रूप से प्रत्येक समूह के भीतर वितरित होता है। भिन्नता का विश्लेषणइस धारणा का समर्थन करने के लिए इसमें ग्राफ़ और आँकड़ों की एक विस्तृत श्रृंखला शामिल है।

विघ्न का प्रभाव.बिल्कुल भी एफपरीक्षण सामान्यता से विचलन के लिए बहुत मजबूत है (विस्तृत परिणामों के लिए, लिंडमैन, 1974 देखें)। यदि कर्टोसिस 0 से अधिक है, तो आँकड़ा का मान है एफबहुत छोटा हो सकता है. शून्य परिकल्पना स्वीकार की जाती है, हालाँकि यह सत्य नहीं हो सकती है। जब कर्टोसिस 0 से कम होता है तो स्थिति उलट जाती है। वितरण विषमता पर आमतौर पर बहुत कम प्रभाव पड़ता है एफआँकड़े. यदि किसी सेल में अवलोकनों की संख्या काफी बड़ी है, तो सामान्यता से विचलन विशेष रूप से महत्वपूर्ण नहीं है केंद्रीय सीमा प्रमेय, जिसके अनुसार प्रारंभिक वितरण की परवाह किए बिना, औसत मूल्य का वितरण सामान्य के करीब है। स्थिरता की विस्तृत चर्चा एफआँकड़े बॉक्स और एंडरसन (1955), या लिंडमैन (1974) में पाए जा सकते हैं।

विचरण की एकरूपता

धारणाएँ.यह माना जाता है कि विभिन्न डिज़ाइन समूहों की भिन्नताएँ समान हैं। इस धारणा को धारणा कहा जाता है विचरण की एकरूपता.याद रखें कि इस खंड की शुरुआत में, वर्ग त्रुटियों के योग की गणना का वर्णन करते समय, हमने प्रत्येक समूह के भीतर योग का प्रदर्शन किया था। यदि दो समूहों में भिन्नताएं एक-दूसरे से भिन्न हैं, तो उन्हें जोड़ना बहुत स्वाभाविक नहीं है और समूह के भीतर कुल भिन्नता का अनुमान नहीं देता है (क्योंकि इस मामले में कोई कुल भिन्नता नहीं है)। मापांक भिन्नता का विश्लेषण -एनोवा/मनोवाविचरण की एकरूपता की धारणाओं से विचलन का पता लगाने के लिए सांख्यिकीय मानदंडों का एक बड़ा सेट शामिल है।

विघ्न का प्रभाव.लिंडमैन (1974, पृष्ठ 33) यह दर्शाता है एफविचरण की एकरूपता की धारणाओं के उल्लंघन के संबंध में मानदंड काफी स्थिर है ( विविधताविचरण, बॉक्स, 1954ए, 1954बी भी देखें; सू, 1938)।

विशेष मामला: साधनों और भिन्नताओं का सहसंबंध।ऐसे भी समय होते हैं जब एफआँकड़े कर सकते हैं गुमराह करनाऐसा तब होता है जब डिज़ाइन कोशिकाओं के साधन विचरण के साथ सहसंबद्ध होते हैं। मापांक भिन्नता का विश्लेषणआपको ऐसे सहसंबंध का पता लगाने के लिए माध्य के विरुद्ध विचरण या मानक विचलन के स्कैटरप्लॉट प्लॉट करने की अनुमति देता है। यह सहसंबंध खतरनाक क्यों है इसका कारण निम्नलिखित है। आइए कल्पना करें कि योजना में 8 सेल हैं, जिनमें से 7 का औसत लगभग समान है, और एक सेल का औसत अन्य की तुलना में बहुत अधिक है। तब एफपरीक्षण सांख्यिकीय रूप से महत्वपूर्ण प्रभाव का पता लगा सकता है। लेकिन मान लीजिए कि बड़े औसत मूल्य वाले सेल में भिन्नता अन्य की तुलना में काफी बड़ी है, यानी। कोशिकाओं में औसत मान और विचरण निर्भर होते हैं (औसत जितना अधिक होगा, विचरण उतना ही अधिक होगा)। इस मामले में, एक बड़ा औसत अविश्वसनीय है क्योंकि यह डेटा में बड़े अंतर के कारण हो सकता है। तथापि एफआँकड़ों पर आधारित यूनाइटेडकोशिकाओं के भीतर भिन्नता भव्य माध्य को पकड़ लेगी, हालांकि प्रत्येक कोशिका के भीतर भिन्नता पर आधारित परीक्षण साधनों में सभी अंतरों को महत्वपूर्ण नहीं मानेंगे।

इस प्रकार का डेटा (बड़ा माध्य और बड़ा विचरण) अक्सर तब होता है जब बाहरी अवलोकन होते हैं। एक या दो बाहरी अवलोकनों से माध्य में काफी बदलाव आता है और विचरण में काफी वृद्धि होती है।

प्रसरण और सहप्रसरण की एकरूपता

धारणाएँ.बहुभिन्नरूपी आश्रित मापों के साथ बहुभिन्नरूपी डिज़ाइन पहले वर्णित विचरण की एकरूपता की धारणा को भी लागू करते हैं। हालाँकि, चूंकि बहुभिन्नरूपी आश्रित चर हैं, इसलिए यह भी आवश्यक है कि उनके क्रॉस-सहसंबंध (सहप्रसरण) डिज़ाइन की सभी कोशिकाओं में एक समान हों। मापांक भिन्नता का विश्लेषणइन धारणाओं का परीक्षण करने के लिए विभिन्न तरीके प्रदान करता है।

विघ्न का प्रभाव. बहुआयामी एनालॉग एफ- मानदंड - विल्क्स का λ-परीक्षण। उपरोक्त मान्यताओं के उल्लंघन के संबंध में विल्क्स λ परीक्षण की मजबूती के बारे में बहुत कुछ ज्ञात नहीं है। हालाँकि, मॉड्यूल की व्याख्या के परिणाम के बाद से भिन्नता का विश्लेषणआमतौर पर अविभाज्य प्रभावों के महत्व पर आधारित होता है (सामान्य मानदंड के महत्व को स्थापित करने के बाद), मजबूती की चर्चा मुख्य रूप से विचरण के अविभाज्य विश्लेषण से संबंधित होती है। इसलिए, अविभाज्य प्रभावों के महत्व की सावधानीपूर्वक जांच की जानी चाहिए।

विशेष मामला: सहप्रसरण का विश्लेषण.विचरण/सहप्रसरण समरूपता का विशेष रूप से गंभीर उल्लंघन तब हो सकता है जब सहसंयोजकों को डिज़ाइन में शामिल किया जाता है। विशेष रूप से, यदि सहसंयोजक और आश्रित उपायों के बीच सहसंबंध डिजाइन में कोशिकाओं में भिन्न होता है, तो परिणामों की गलत व्याख्या हो सकती है। याद रखें कि सहप्रसरण का विश्लेषण अनिवार्य रूप से प्रत्येक कोशिका के भीतर विचरण के उस हिस्से को अलग करने के लिए एक प्रतिगमन विश्लेषण करता है जो सहसंयोजक द्वारा होता है। विचरण/सहप्रसरण धारणा की एकरूपता मानती है कि यह प्रतिगमन विश्लेषण निम्नलिखित बाधा के तहत आयोजित किया जाता है: सभी कोशिकाओं के लिए सभी प्रतिगमन समीकरण (ढलान) समान हैं। यदि ऐसा नहीं माना गया तो बड़ी त्रुटियाँ सामने आ सकती हैं। मापांक भिन्नता का विश्लेषणइस धारणा का परीक्षण करने के लिए कई विशेष मानदंड हैं। यह सुनिश्चित करने के लिए इन मानदंडों का उपयोग करना उचित है कि विभिन्न कोशिकाओं के लिए प्रतिगमन समीकरण लगभग समान हैं।

गोलाकारता और जटिल समरूपता: विचरण के विश्लेषण में बार-बार माप के लिए बहुभिन्नरूपी दृष्टिकोण का उपयोग करने के कारण

दो से अधिक स्तरों वाले बार-बार माप वाले कारकों वाले डिज़ाइन में, यूनीवेरिएट एनोवा के उपयोग के लिए अतिरिक्त मान्यताओं की आवश्यकता होती है: यौगिक समरूपता धारणा और गोलाकार धारणा। ये धारणाएँ शायद ही कभी पूरी होती हैं (नीचे देखें)। इसलिए, हाल के वर्षों में, विचरण के बहुभिन्नरूपी विश्लेषण ने ऐसे डिज़ाइनों में लोकप्रियता हासिल की है (दोनों दृष्टिकोण मॉड्यूल में संयुक्त हैं) भिन्नता का विश्लेषण).

जटिल समरूपता की धारणायौगिक समरूपता की धारणा यह है कि अलग-अलग दोहराए गए मापों के लिए प्रसरण (समूहों के भीतर साझा) और सहप्रसरण (समूहों के भीतर साझा) सजातीय (समान) हैं। बार-बार किए गए उपायों के वैध होने के लिए यूनीवेरिएट एफ परीक्षण के लिए यह एक पर्याप्त शर्त है (यानी, रिपोर्ट किए गए एफ मान औसतन एफ वितरण के अनुरूप हैं)। हालाँकि, इस मामले में यह शर्त आवश्यक नहीं है।

गोलाकारता की धारणा.एफ-परीक्षण के वैध होने के लिए गोलाकारता की धारणा एक आवश्यक और पर्याप्त शर्त है। यह इस तथ्य में निहित है कि समूहों के भीतर सभी अवलोकन स्वतंत्र और समान रूप से वितरित होते हैं। इन धारणाओं की प्रकृति और उनके उल्लंघन के प्रभाव को आमतौर पर एनोवा की पुस्तकों में अच्छी तरह से वर्णित नहीं किया गया है - इन्हें निम्नलिखित पैराग्राफ में शामिल किया जाएगा। यह भी दिखाया जाएगा कि एक अविभाज्य दृष्टिकोण के परिणाम बहुभिन्नरूपी दृष्टिकोण के परिणामों से भिन्न हो सकते हैं, और यह समझाया जाएगा कि इसका क्या अर्थ है।

परिकल्पनाओं की स्वतंत्रता की आवश्यकता.एनोवा में डेटा का विश्लेषण करने का सामान्य तरीका है मॉडल फिटिंग. यदि, मॉडल के सापेक्ष जो डेटा फिट बैठता है, तो कुछ हैं संभवतःपरिकल्पनाएँ, फिर इन परिकल्पनाओं (मुख्य प्रभावों, अंतःक्रियाओं के लिए मानदंड) का परीक्षण करने के लिए विचरण को विभाजित किया जाता है। कम्प्यूटेशनल दृष्टिकोण से, यह दृष्टिकोण विरोधाभासों का एक सेट (योजना साधनों की तुलनाओं का एक सेट) उत्पन्न करता है। हालाँकि, यदि विरोधाभास एक-दूसरे से स्वतंत्र नहीं हैं, तो भिन्नताओं का विभाजन अर्थहीन हो जाता है। उदाहरण के लिए, यदि दो विरोधाभास हैं एऔर बीसमान हैं और विचरण का संगत भाग निकाला जाता है, फिर वही भाग दो बार निकाला जाता है। उदाहरण के लिए, दो परिकल्पनाओं की पहचान करना मूर्खतापूर्ण और निरर्थक है: "सेल 1 में माध्य सेल 2 में माध्य से अधिक है" और "सेल 1 में माध्य सेल 2 में माध्य से अधिक है।" इसलिए, परिकल्पनाएँ स्वतंत्र या ऑर्थोगोनल होनी चाहिए।

बार-बार माप में स्वतंत्र परिकल्पनाएँ।मॉड्यूल में सामान्य एल्गोरिदम लागू किया गया भिन्नता का विश्लेषण, प्रत्येक प्रभाव के लिए स्वतंत्र (ऑर्थोगोनल) कंट्रास्ट उत्पन्न करने का प्रयास करेगा। बार-बार मापे जाने वाले कारक के लिए, ये विरोधाभास कई परिकल्पनाएँ प्रदान करते हैं मतभेदविचाराधीन कारक के स्तरों के बीच। हालाँकि, यदि इन मतभेदों को समूहों के भीतर सहसंबद्ध किया जाता है, तो परिणामी विरोधाभास अब स्वतंत्र नहीं हैं। उदाहरण के लिए, शिक्षण में जहां छात्रों को एक सेमेस्टर में तीन बार मापा जाता है, ऐसा हो सकता है कि पहले और दूसरे माप के बीच परिवर्तन विषयों के दूसरे और तीसरे माप के बीच परिवर्तन के साथ नकारात्मक रूप से सहसंबद्ध हो। जिन लोगों ने पहले और दूसरे आयामों के बीच अधिकांश सामग्री में महारत हासिल कर ली है, वे दूसरे और तीसरे आयामों के बीच बीते समय के दौरान एक छोटे हिस्से में महारत हासिल कर लेते हैं। वास्तव में, अधिकांश मामलों में जहां एनोवा का उपयोग बार-बार माप के लिए किया जाता है, स्तरों में परिवर्तन को विषयों के बीच सहसंबद्ध माना जा सकता है। हालाँकि, जब ऐसा होता है, तो जटिल समरूपता धारणा और गोलाकार धारणा मान्य नहीं होती है और स्वतंत्र विरोधाभासों की गणना नहीं की जा सकती है।

उल्लंघनों का प्रभाव और उन्हें ठीक करने के तरीके.जब जटिल समरूपता या गोलाकार धारणाएं पूरी नहीं होती हैं, तो एनोवा गलत परिणाम दे सकता है। बहुभिन्नरूपी प्रक्रियाओं के पर्याप्त रूप से विकसित होने से पहले, इन धारणाओं के उल्लंघन की भरपाई के लिए कई धारणाएँ प्रस्तावित की गईं थीं। (उदाहरण के लिए, ग्रीनहाउस और गीसर, 1959 और हुइन्ह और फेल्ड्ट, 1970 देखें)। ये विधियाँ अभी भी व्यापक रूप से उपयोग की जाती हैं (यही कारण है कि इन्हें मॉड्यूल में प्रस्तुत किया गया है भिन्नता का विश्लेषण).

दोहराए गए मापों के लिए विचरण दृष्टिकोण का बहुभिन्नरूपी विश्लेषण।सामान्य तौर पर, जटिल समरूपता और गोलाकारता की समस्याएं इस तथ्य से संबंधित हैं कि दोहराए गए माप कारकों (2 से अधिक स्तरों के साथ) के प्रभावों के अध्ययन में शामिल विरोधाभासों के सेट एक दूसरे से स्वतंत्र नहीं हैं। हालाँकि, यदि उपयोग किया जाए तो उन्हें स्वतंत्र होने की आवश्यकता नहीं है बहुआयामीदो या दो से अधिक दोहराए गए माप कारक विरोधाभासों के सांख्यिकीय महत्व का एक साथ परीक्षण करने के लिए एक परीक्षण। यही कारण है कि 2 से अधिक स्तरों वाले अविभाज्य दोहराए गए माप कारकों के महत्व का परीक्षण करने के लिए विचरण तकनीकों का बहुभिन्नरूपी विश्लेषण तेजी से उपयोग किया जाने लगा है। यह दृष्टिकोण व्यापक रूप से स्वीकार किया जाता है क्योंकि इसमें आम तौर पर जटिल समरूपता या गोलाकारता की आवश्यकता नहीं होती है।

ऐसे मामले जिनमें विचरण दृष्टिकोण के बहुभिन्नरूपी विश्लेषण का उपयोग नहीं किया जा सकता है।ऐसे उदाहरण (डिज़ाइन) हैं जहां विचरण दृष्टिकोण का बहुभिन्नरूपी विश्लेषण लागू नहीं किया जा सकता है। ये आम तौर पर ऐसे मामले होते हैं जहां डिज़ाइन में विषयों की संख्या कम होती है और बार-बार मापे जाने वाले कारक में कई स्तर होते हैं। बहुभिन्नरूपी विश्लेषण करने के लिए बहुत कम अवलोकन हो सकते हैं। उदाहरण के लिए, यदि 12 विषय हैं, पी = 4 बार-बार माप कारक, और प्रत्येक कारक है क = 3 स्तर. फिर 4 कारकों की परस्पर क्रिया "उपभोग" करेगी (क-1)पी = 2 4 = 16 स्वतंत्रता की कोटियां। हालाँकि, केवल 12 विषय हैं, इसलिए इस उदाहरण में बहुभिन्नरूपी परीक्षण नहीं किया जा सकता है। मापांक भिन्नता का विश्लेषणस्वतंत्र रूप से इन अवलोकनों का पता लगाएगा और केवल एक-आयामी मानदंडों की गणना करेगा।

एकविभिन्न और बहुभिन्नरूपी परिणामों में अंतर.यदि किसी अध्ययन में बड़ी संख्या में बार-बार किए गए उपाय शामिल हैं, तो ऐसे मामले भी हो सकते हैं, जहां एकतरफा दोहराया गया उपाय एनोवा दृष्टिकोण ऐसे परिणाम उत्पन्न करता है जो बहुभिन्नरूपी दृष्टिकोण से प्राप्त परिणामों से बहुत भिन्न होते हैं। इसका मतलब यह है कि संबंधित दोहराए गए मापों के स्तरों के बीच का अंतर सभी विषयों में सहसंबद्ध है। कभी-कभी यह तथ्य कुछ स्वतंत्र हित का होता है।

विचरण और संरचनात्मक समीकरण मॉडलिंग का बहुभिन्नरूपी विश्लेषण

हाल के वर्षों में, संरचनात्मक समीकरण मॉडलिंग विचरण के बहुभिन्नरूपी विश्लेषण के विकल्प के रूप में लोकप्रिय हो गया है (उदाहरण के लिए, बागोजी और यी, 1989; बागोजी, यी और सिंह, 1991; कोल, मैक्सवेल, अर्वे और सालास, 1993 देखें) . यह दृष्टिकोण न केवल विभिन्न समूहों में साधनों के बारे में, बल्कि आश्रित चर के सहसंबंध मैट्रिक्स के बारे में भी परिकल्पनाओं का परीक्षण करने की अनुमति देता है। उदाहरण के लिए, कोई प्रसरण और सहप्रसरण की एकरूपता की धारणाओं को शिथिल कर सकता है और प्रत्येक समूह के लिए मॉडल में त्रुटि प्रसरण और सहप्रसरण को स्पष्ट रूप से शामिल कर सकता है। मापांक सांख्यिकीसंरचनात्मक समीकरण मॉडलिंग (SEPATH) (खंड III देखें) ऐसे विश्लेषण की अनुमति देता है।

इस नोट में सांख्यिकी के उपयोग को एक क्रॉस-कटिंग उदाहरण के साथ चित्रित किया जाएगा। मान लीजिए कि आप परफेक्ट पैराशूट में प्रोडक्शन मैनेजर हैं। पैराशूट चार अलग-अलग आपूर्तिकर्ताओं द्वारा आपूर्ति किए गए सिंथेटिक फाइबर से बने होते हैं। पैराशूट की मुख्य विशेषताओं में से एक इसकी ताकत है। आपको यह सुनिश्चित करना होगा कि आपूर्ति किए गए सभी फाइबर समान ताकत के हों। इस प्रश्न का उत्तर देने के लिए, विभिन्न आपूर्तिकर्ताओं से सिंथेटिक फाइबर से बुने गए पैराशूट की ताकत को मापने के लिए एक प्रयोगात्मक डिजाइन तैयार किया जाना चाहिए। इस प्रयोग से प्राप्त जानकारी यह निर्धारित करेगी कि कौन सा आपूर्तिकर्ता सबसे टिकाऊ पैराशूट प्रदान करता है।

कई अनुप्रयोगों में ऐसे प्रयोग शामिल होते हैं जो एक ही कारक के कई समूहों या स्तरों पर विचार करते हैं। कुछ कारक, जैसे सिरेमिक फायरिंग तापमान, के कई संख्यात्मक स्तर हो सकते हैं (अर्थात 300°, 350°, 400° और 450°)। अन्य कारक, जैसे सुपरमार्केट में वस्तुओं का स्थान, के श्रेणीबद्ध स्तर हो सकते हैं (उदाहरण के लिए, पहला आपूर्तिकर्ता, दूसरा आपूर्तिकर्ता, तीसरा आपूर्तिकर्ता, चौथा आपूर्तिकर्ता)। एकल-कारक प्रयोग जिसमें प्रयोगात्मक इकाइयों को यादृच्छिक रूप से समूहों या कारक स्तरों को सौंपा जाता है, पूरी तरह से यादृच्छिक कहा जाता है।

प्रयोगएफ-कई गणितीय अपेक्षाओं के बीच अंतर का आकलन करने के लिए मानदंड

यदि समूहों में कारक की संख्यात्मक माप निरंतर है और कुछ अतिरिक्त शर्तें पूरी होती हैं, तो कई समूहों की गणितीय अपेक्षाओं की तुलना करने के लिए विचरण का विश्लेषण (एनोवा) का उपयोग किया जाता है। एकविश्लेषण हेएफ वारियांस)। पूरी तरह से यादृच्छिक डिज़ाइन का उपयोग करके विचरण के विश्लेषण को एक-तरफ़ा एनोवा प्रक्रिया कहा जाता है। कुछ मायनों में, विचरण का विश्लेषण शब्द एक मिथ्या नाम है क्योंकि यह भिन्नताओं के बजाय समूहों के अपेक्षित मूल्यों के बीच अंतर की तुलना करता है। हालाँकि, गणितीय अपेक्षाओं की तुलना सटीक रूप से डेटा भिन्नता के विश्लेषण के आधार पर की जाती है। एनोवा प्रक्रिया में, माप परिणामों में कुल भिन्नता को समूहों के बीच और भीतर-समूहों में विभाजित किया जाता है (चित्र 1)। समूह के भीतर भिन्नता को प्रयोगात्मक त्रुटि द्वारा समझाया गया है, और समूह के बीच भिन्नता को प्रयोगात्मक स्थितियों के प्रभावों द्वारा समझाया गया है। प्रतीक साथसमूहों की संख्या को दर्शाता है.

चावल। 1. पूरी तरह से यादृच्छिक प्रयोग में भिन्नता का विभाजन

नोट को प्रारूप में डाउनलोड करें, प्रारूप में उदाहरण

चलिए ऐसा दिखावा करते हैं साथसमूह स्वतंत्र आबादी से निकाले जाते हैं जिनका सामान्य वितरण और समान भिन्नता होती है। शून्य परिकल्पना यह है कि जनसंख्या की गणितीय अपेक्षाएँ समान हैं: एच 0: μ 1 = μ 2 = ... = μ s. वैकल्पिक परिकल्पना बताती है कि सभी गणितीय अपेक्षाएँ समान नहीं हैं: एच 1: सभी μ j समान नहीं हैं जे= 1, 2, …, एस)।

चित्र में. चित्र 2 पांच तुलनात्मक समूहों की गणितीय अपेक्षाओं के बारे में सच्ची शून्य परिकल्पना प्रस्तुत करता है, बशर्ते कि आबादी का सामान्य वितरण और समान विचरण हो। कारक के विभिन्न स्तरों से जुड़ी पाँच जनसंख्याएँ समान हैं। परिणामस्वरूप, समान गणितीय अपेक्षा, भिन्नता और आकार रखते हुए, वे एक-दूसरे पर आरोपित हो जाते हैं।

चावल। 2. पांच सामान्य आबादी की गणितीय अपेक्षा समान है: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

दूसरी ओर, मान लीजिए कि वास्तव में शून्य परिकल्पना झूठी है, चौथे स्तर पर उच्चतम अपेक्षित मूल्य है, पहले स्तर पर थोड़ा कम अपेक्षित मूल्य है, और शेष स्तरों में समान और उससे भी कम अपेक्षित मूल्य हैं ( चित्र तीन)। ध्यान दें कि, अपेक्षित मूल्यों के अपवाद के साथ, सभी पांच आबादी समान हैं (अर्थात, उनकी परिवर्तनशीलता और आकार समान है)।

चावल। 3. प्रायोगिक स्थितियों का प्रभाव देखा जाता है: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

कई सामान्य आबादी की गणितीय अपेक्षाओं की समानता के बारे में परिकल्पना का परीक्षण करते समय, कुल भिन्नता को दो भागों में विभाजित किया जाता है: अंतरसमूह भिन्नता, समूहों के बीच अंतर के कारण, और इंट्राग्रुप भिन्नता, एक ही समूह से संबंधित तत्वों के बीच अंतर के कारण। कुल भिन्नता वर्गों के कुल योग (एसएसटी - कुल वर्गों का योग) द्वारा व्यक्त की जाती है। चूँकि शून्य परिकल्पना सभी की गणितीय अपेक्षाएँ है साथसमूह एक-दूसरे के बराबर हैं, कुल भिन्नता व्यक्तिगत अवलोकनों और सभी नमूनों के लिए गणना किए गए समग्र औसत (औसत का औसत) के बीच वर्ग अंतर के योग के बराबर है। पूर्ण विविधता:

कहाँ - सामान्य औसत, एक्स आईजे - मैं-ई अवलोकन में जे-समूह या स्तर, एन जे- में टिप्पणियों की संख्या जेवें समूह, एन- सभी समूहों में अवलोकनों की कुल संख्या (अर्थात्। एन = एन 1 + एन 2 + … + एन सी), साथ- अध्ययन किए गए समूहों या स्तरों की संख्या।

समूह के बीच भिन्नता, जिसे आमतौर पर वर्गों के बीच के वर्गों का योग कहा जाता है (एसएसए - समूहों के बीच वर्गों का योग), प्रत्येक समूह के नमूना माध्य के बीच अंतर के वर्गों के योग के बराबर है जेऔर कुल मिलाकर औसत , संबंधित समूह के आयतन से गुणा किया जाता है एन जे:

कहाँ साथ- अध्ययन किए गए समूहों या स्तरों की संख्या, एन जे- में टिप्पणियों की संख्या जेवें समूह, जे- औसत मूल्य जेवें समूह, - कुल मिलाकर औसत।

समूह के भीतर भिन्नता, जिसे आमतौर पर समूहों के भीतर वर्गों का योग कहा जाता है (एसएसडब्ल्यू - समूहों के साथ वर्गों का योग), प्रत्येक समूह के तत्वों और इस समूह के नमूना माध्य के बीच अंतर के वर्गों के योग के बराबर है जे:

कहाँ एक्सआईजे - मैंवां तत्व जेवें समूह, जे- औसत मूल्य जेवें समूह.

चूँकि उनकी तुलना की जाती है साथकारक स्तर, वर्गों का अंतरसमूह योग है एस - 1स्वतंत्रता की कोटियां। की प्रत्येक साथस्तर है एन जे – 1 स्वतंत्रता की डिग्री, इसलिए वर्गों का इंट्राग्रुप योग है एन- साथस्वतंत्रता की डिग्री, और

इसके अलावा, वर्गों का कुल योग है एन – 1 प्रत्येक अवलोकन के बाद से स्वतंत्रता की डिग्री एक्सआईजेसभी पर गणना किए गए कुल औसत से तुलना की जाती है एनअवलोकन. यदि इनमें से प्रत्येक योग को स्वतंत्रता की डिग्री की संगत संख्या से विभाजित किया जाता है, तो तीन प्रकार के फैलाव उत्पन्न होते हैं: अंतरसमूह(माध्य वर्ग - एमएसए), इंट्राग्रुप(अंदर का माध्य वर्ग - MSW) और भरा हुआ(कुल माध्य वर्ग - एमएसटी):

इस तथ्य के बावजूद कि विचरण के विश्लेषण का मुख्य उद्देश्य गणितीय अपेक्षाओं की तुलना करना है साथप्रायोगिक स्थितियों के प्रभाव की पहचान करने के लिए समूहों का नाम इस तथ्य के कारण है कि मुख्य उपकरण विभिन्न प्रकार के भिन्नताओं का विश्लेषण है। यदि शून्य परिकल्पना सत्य है, और गणितीय अपेक्षाओं के बीच साथसमूहों में कोई महत्वपूर्ण अंतर नहीं है, सभी तीन भिन्नताएं - एमएसए, एमएसडब्ल्यू और एमएसटी - भिन्नता अनुमान हैं σ 2विश्लेषण किए गए डेटा में निहित है। इस प्रकार, शून्य परिकल्पना का परीक्षण करना एच 0: μ 1 = μ 2 = ... = μ sऔर वैकल्पिक परिकल्पना एच 1: सभी μ j समान नहीं हैं जे = 1, 2, …, साथ), आँकड़ों की गणना करना आवश्यक है एफ-मानदंड, जो दो भिन्नताओं, एमएसए और एमएसडब्ल्यू का अनुपात है। परीक्षा एफ-विचरण के एकतरफ़ा विश्लेषण में आँकड़े

आंकड़े एफ-मानदंड के अधीन एफ-वितरण के साथ एस - 1अंश में स्वतंत्रता की डिग्री एम.एस.ए.और एन - एसहर में स्वतंत्रता की डिग्री एम.एस.डब्ल्यू.. किसी दिए गए महत्व स्तर α के लिए, गणना करने पर शून्य परिकल्पना खारिज कर दी जाती है एफ एफयू, अंतर्निहित एफ-वितरण के साथ एस - 1 एन - एसहर में स्वतंत्रता की डिग्री. अतः, आकृति में दर्शाए गए अनुसार। 4, निर्णय नियम निम्नानुसार तैयार किया गया है: शून्य परिकल्पना एच 0यदि अस्वीकार कर दिया गया एफ>एफयू; अन्यथा इसे अस्वीकार नहीं किया जाता है.

चावल। 4. किसी परिकल्पना का परीक्षण करते समय विचरण के विश्लेषण का महत्वपूर्ण क्षेत्र एच 0

यदि शून्य परिकल्पना एच 0सत्य है, परिकलित एफ-सांख्यिकी 1 के करीब है, क्योंकि इसके अंश और हर एक ही मात्रा के अनुमान हैं - विश्लेषित डेटा में निहित फैलाव σ 2। यदि शून्य परिकल्पना एच 0गलत है (और विभिन्न समूहों की गणितीय अपेक्षाओं के बीच एक महत्वपूर्ण अंतर है), गणना की गई एफ-सांख्यिकी एक से बहुत बड़ी होगी क्योंकि इसका अंश, एमएसए, डेटा की प्राकृतिक परिवर्तनशीलता के अलावा, प्रयोगात्मक स्थितियों के प्रभाव या समूहों के बीच अंतर का अनुमान लगाता है, जबकि हर एमएसडब्ल्यू केवल डेटा की प्राकृतिक परिवर्तनशीलता का अनुमान लगाता है। . इस प्रकार, एनोवा प्रक्रिया है एफ-मानदंड जिसमें, दिए गए महत्व स्तर α पर, गणना करने पर शून्य परिकल्पना खारिज कर दी जाती है एफ-आँकड़े ऊपरी महत्वपूर्ण मूल्य से अधिक हैं एफयू, अंतर्निहित एफ-वितरण के साथ एस - 1अंश में स्वतंत्रता की डिग्री और एन - एसहर में स्वतंत्रता की डिग्री, जैसा कि चित्र में दिखाया गया है। 4.

विचरण के एक-तरफ़ा विश्लेषण को स्पष्ट करने के लिए, आइए नोट की शुरुआत में उल्लिखित परिदृश्य पर वापस जाएँ। प्रयोग का उद्देश्य यह निर्धारित करना है कि क्या विभिन्न आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने गए पैराशूट की ताकत समान है। प्रत्येक समूह में पाँच पैराशूट होते हैं। समूहों को आपूर्तिकर्ता द्वारा विभाजित किया गया है - आपूर्तिकर्ता 1, आपूर्तिकर्ता 2, आपूर्तिकर्ता 3 और आपूर्तिकर्ता 4। पैराशूट की ताकत को एक विशेष उपकरण का उपयोग करके मापा जाता है जो दोनों तरफ से कपड़े के फटने का परीक्षण करता है। पैराशूट को तोड़ने के लिए आवश्यक बल को एक विशेष पैमाने पर मापा जाता है। तोड़ने वाला बल जितना अधिक होगा, पैराशूट उतना ही मजबूत होगा। एक्सेल आपको विश्लेषण करने की अनुमति देता है एफ-एक क्लिक में आँकड़े। मेनू के माध्यम से जाओ डेटा → डेटा विश्लेषण, और पंक्ति का चयन करें एक तरफ़ा एनोवा, खुलने वाली विंडो को भरें (चित्र 5)। प्रायोगिक परिणाम (ब्रेकिंग स्ट्रेंथ), कुछ वर्णनात्मक आँकड़े और विचरण के एक-तरफ़ा विश्लेषण के परिणाम चित्र में प्रस्तुत किए गए हैं। 6.

चावल। 5. खिड़की वेरिएंस विश्लेषण पैकेज का एक-तरफ़ा विश्लेषणएक्सेल

चावल। 6. विभिन्न आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने हुए पैराशूट के शक्ति संकेतक, वर्णनात्मक आँकड़े और विचरण के एक-तरफ़ा विश्लेषण के परिणाम

चित्र 6 के विश्लेषण से पता चलता है कि नमूना साधनों के बीच कुछ अंतर है। पहले आपूर्तिकर्ता से प्राप्त फाइबर की औसत ताकत 19.52 है, दूसरे से - 24.26, तीसरे से - 22.84 और चौथे से - 21.16। क्या यह अंतर सांख्यिकीय रूप से महत्वपूर्ण है? टूटना बल का वितरण स्कैटर प्लॉट (चित्र 7) में प्रदर्शित किया गया है। यह स्पष्ट रूप से समूहों के बीच और भीतर दोनों में अंतर दिखाता है। यदि प्रत्येक समूह आकार में बड़ा होता, तो उनका विश्लेषण करने के लिए तना-और-पत्ती आरेख, बॉक्स प्लॉट या बेल प्लॉट का उपयोग किया जा सकता था।

चावल। 7. चार आपूर्तिकर्ताओं से प्राप्त सिंथेटिक फाइबर से बुने गए पैराशूट के लिए शक्ति फैलाव का आरेख।

शून्य परिकल्पना बताती है कि औसत शक्ति स्कोर के बीच कोई महत्वपूर्ण अंतर नहीं है: एच 0: μ 1 = μ 2 = μ 3 = μ 4. एक वैकल्पिक परिकल्पना यह है कि कम से कम एक आपूर्तिकर्ता ऐसा है जिसकी औसत फाइबर ताकत दूसरों से भिन्न है: एच 1: सभी μ j समान नहीं हैं ( जे = 1, 2, …, साथ).

कुल मिलाकर औसत (चित्र 6 देखें) = औसत(डी12:डी15) = 21.945; निर्धारित करने के लिए, आप सभी 20 मूल संख्याओं का औसत भी निकाल सकते हैं: = औसत(ए3:डी7)। विचरण मानों की गणना की जाती है विश्लेषण पैकेजऔर प्लेट में प्रतिबिंबित होते हैं भिन्नता का विश्लेषण(चित्र 6 देखें): एसएसए = 63.286, एसएसडब्ल्यू = 97.504, एसएसटी = 160.790 (कॉलम देखें) एसएसटेबल भिन्नता का विश्लेषणचित्र 6). औसत की गणना वर्गों के इन योगों को स्वतंत्रता की डिग्री की उचित संख्या से विभाजित करके की जाती है। क्योंकि साथ= 4, ए एन= 20, हमें स्वतंत्रता की कोटि के निम्नलिखित मान प्राप्त होते हैं; एसएसए के लिए: एस - 1=3; एसएसडब्ल्यू के लिए: एन सी= 16; एसएसटी के लिए: एन - 1= 19 (कॉलम देखें डीएफ). इस प्रकार: एमएसए = एसएसए / ( एस - 1)= 21.095; एमएसडब्ल्यू = एसएसडब्ल्यू / ( एन सी) = 6.094; एमएसटी = एसएसटी /( एन - 1) = 8.463 (कॉलम देखें एमएस). एफ-सांख्यिकी = एमएसए/एमएसडब्ल्यू = 3.462 (कॉलम देखें)। एफ).

ऊपरी महत्वपूर्ण मूल्य एफयू, विशेषता एफ-वितरण, सूत्र द्वारा निर्धारित =F.OBR(0.95;3;16) = 3.239. फ़ंक्शन के पैरामीटर =F.OBR(): α = 0.05, अंश के पास स्वतंत्रता की तीन डिग्री है, और हर के पास 16 है। इस प्रकार, गणना की गई एफ-3.462 के बराबर आँकड़ा ऊपरी महत्वपूर्ण मान से अधिक है एफयू= 3.239, शून्य परिकल्पना अस्वीकृत की जाती है (चित्र 8)।

चावल। 8. 0.05 के महत्व स्तर पर विचरण के विश्लेषण का महत्वपूर्ण क्षेत्र यदि अंश में स्वतंत्रता की तीन डिग्री है और हर -16 है

आर-मूल्य, यानी संभावना है कि यदि शून्य परिकल्पना सत्य है एफ-आंकड़े 3.46 से कम नहीं, 0.041 या 4.1% के बराबर (कॉलम देखें) पी-मूल्यटेबल भिन्नता का विश्लेषणचित्र 6). चूंकि यह मान महत्व स्तर α = 5% से अधिक नहीं है, इसलिए शून्य परिकल्पना खारिज कर दी जाती है। इसके अतिरिक्त, आर-मूल्य इंगित करता है कि सामान्य आबादी की गणितीय अपेक्षाओं के बीच इस तरह के या अधिक अंतर का पता लगाने की संभावना, बशर्ते कि वे वास्तव में समान हों, 4.1% के बराबर है।

इसलिए। चारों नमूना माध्यों में अंतर है। शून्य परिकल्पना यह थी कि चार आबादी की सभी गणितीय अपेक्षाएँ समान हैं। इन शर्तों के तहत, सभी पैराशूटों की ताकत की कुल परिवर्तनशीलता (यानी कुल एसएसटी भिन्नता) की माप की गणना प्रत्येक अवलोकन के बीच वर्ग अंतर को जोड़कर की जाती है। एक्स आईजेऔर कुल मिलाकर औसत . फिर कुल भिन्नता को दो घटकों में विभाजित किया गया (चित्र 1 देखें)। पहला घटक एसएसए में समूह के बीच भिन्नता थी और दूसरा एसएसडब्ल्यू में समूह के भीतर भिन्नता थी।

डेटा में परिवर्तनशीलता क्या बताती है? दूसरे शब्दों में, सभी अवलोकन एक जैसे क्यों नहीं हैं? एक कारण यह है कि अलग-अलग कंपनियां अलग-अलग ताकत के फाइबर की आपूर्ति करती हैं। यह आंशिक रूप से बताता है कि समूहों की अलग-अलग गणितीय अपेक्षाएँ क्यों हैं: प्रयोगात्मक स्थितियों का प्रभाव जितना मजबूत होगा, समूहों की गणितीय अपेक्षाओं के बीच अंतर उतना ही अधिक होगा। डेटा परिवर्तनशीलता का एक अन्य कारण किसी भी प्रक्रिया की प्राकृतिक परिवर्तनशीलता है, इस मामले में पैराशूट का उत्पादन। भले ही सभी फाइबर एक ही आपूर्तिकर्ता से खरीदे गए हों, उनकी ताकत समान नहीं होगी, अन्य सभी चीजें समान होंगी। चूँकि यह प्रभाव प्रत्येक समूह के भीतर होता है, इसलिए इसे समूह के भीतर भिन्नता कहा जाता है।

नमूना साधनों के बीच अंतर को अंतरसमूह भिन्नता एसएसए कहा जाता है। समूह के भीतर भिन्नता का एक हिस्सा, जैसा कि पहले ही संकेत दिया गया है, डेटा के विभिन्न समूहों से संबंधित होने से समझाया गया है। हालाँकि, भले ही समूह बिल्कुल एक जैसे हों (यानी, शून्य परिकल्पना सत्य थी), समूह के बीच भिन्नता अभी भी मौजूद होगी। इसका कारण पैराशूट निर्माण प्रक्रिया की प्राकृतिक परिवर्तनशीलता है। क्योंकि नमूने अलग-अलग हैं, उनके नमूना साधन एक-दूसरे से भिन्न हैं। इसलिए, यदि शून्य परिकल्पना सत्य है, तो समूह के बीच और भीतर की परिवर्तनशीलता दोनों जनसंख्या परिवर्तनशीलता के अनुमान का प्रतिनिधित्व करती हैं। यदि शून्य परिकल्पना गलत है, तो समूहों के बीच की परिकल्पना बड़ी होगी। यही वह तथ्य है जो इसका आधार है एफ-कई समूहों की गणितीय अपेक्षाओं के बीच अंतर की तुलना करने के लिए मानदंड।

एक-तरफ़ा एनोवा का प्रदर्शन करने और फर्मों के बीच महत्वपूर्ण अंतर खोजने के बाद, यह अज्ञात रहता है कि कौन सा आपूर्तिकर्ता दूसरों से काफी अलग है। हम केवल इतना जानते हैं कि सामान्य आबादी की गणितीय अपेक्षाएँ समान नहीं हैं। दूसरे शब्दों में, कम से कम एक गणितीय अपेक्षा दूसरों से काफी भिन्न है। यह निर्धारित करने के लिए कि कौन सा आपूर्तिकर्ता दूसरों से अलग है, आप इसका उपयोग कर सकते हैं तुकी प्रक्रिया, आपूर्तिकर्ताओं के बीच जोड़ीवार तुलना का उपयोग करना। यह प्रक्रिया जॉन टुकी द्वारा विकसित की गई थी। इसके बाद, उन्होंने और के. क्रेमर ने उन स्थितियों के लिए इस प्रक्रिया को स्वतंत्र रूप से संशोधित किया जिनमें नमूना आकार एक दूसरे से भिन्न होते हैं।

एकाधिक तुलना: तुकी-क्रेमर प्रक्रिया

हमारे परिदृश्य में, पैराशूट की ताकत की तुलना करने के लिए विचरण के एक-तरफ़ा विश्लेषण का उपयोग किया गया था। चार समूहों की गणितीय अपेक्षाओं के बीच महत्वपूर्ण अंतर पाए जाने के बाद, यह निर्धारित करना आवश्यक है कि कौन से समूह एक दूसरे से भिन्न हैं। हालाँकि इस समस्या को हल करने के कई तरीके हैं, हम केवल तुकी-क्रेमर एकाधिक तुलना प्रक्रिया का वर्णन करेंगे। यह विधि पोस्ट हॉक तुलना प्रक्रियाओं का एक उदाहरण है क्योंकि परीक्षण की जा रही परिकल्पना डेटा विश्लेषण के बाद तैयार की जाती है। तुकी-क्रेमर प्रक्रिया समूहों के सभी जोड़ियों की एक साथ तुलना करने की अनुमति देती है। पहले चरण में, अंतर की गणना की जाती है एक्सजे -एक्सजे ’ , कहाँ जे ≠जे’ , गणितीय अपेक्षाओं के बीच एस(एस - 1)/2समूह. गंभीर दायरातुकी-क्रेमर प्रक्रिया की गणना सूत्र द्वारा की जाती है:

कहाँ क्यू यू- छात्रीकृत श्रेणी वितरण का ऊपरी महत्वपूर्ण मूल्य, जो है साथअंश में स्वतंत्रता की डिग्री और एन - साथहर में स्वतंत्रता की डिग्री.

यदि नमूना आकार समान नहीं हैं, तो गणितीय अपेक्षाओं की प्रत्येक जोड़ी के लिए महत्वपूर्ण सीमा की गणना अलग से की जाती है। अंतिम चरण में, प्रत्येक एस(एस - 1)/2गणितीय अपेक्षाओं के जोड़े की तुलना संबंधित महत्वपूर्ण सीमा से की जाती है। यदि अंतर मापांक | हो तो एक जोड़ी के तत्वों को काफी भिन्न माना जाता है एक्सजे -एक्सजे ’ | उनके बीच महत्वपूर्ण सीमा से अधिक है।

आइए पैराशूट की ताकत की समस्या पर तुकी-क्रेमर प्रक्रिया लागू करें। चूंकि पैराशूट कंपनी के चार आपूर्तिकर्ता हैं, इसलिए जांच के लिए आपूर्तिकर्ताओं के 4(4 - 1)/2 = 6 जोड़े हैं (चित्र 9)।

चावल। 9. नमूना साधनों की जोड़ीवार तुलना

चूँकि सभी समूहों का आयतन समान है (अर्थात् सभी)। एन जे = एन जे ’ ), यह केवल एक महत्वपूर्ण सीमा की गणना करने के लिए पर्याप्त है। ऐसा करने के लिए, तालिका के अनुसार एनोवा(चित्र 6) हम MSW = 6.094 का मान निर्धारित करते हैं। तब हम मूल्य ज्ञात करते हैं क्यू यूα = 0.05 पर, साथ= 4 (अंश में स्वतंत्रता की डिग्री की संख्या) और एन- साथ= 20 – 4 = 16 (हर में स्वतंत्रता की डिग्री की संख्या)। दुर्भाग्य से, मुझे एक्सेल में संबंधित फ़ंक्शन नहीं मिला, इसलिए मैंने तालिका का उपयोग किया (चित्र 10)।

चावल। 10. छात्रीकृत सीमा का महत्वपूर्ण मूल्य क्यू यू

हम पाते हैं:

चूँकि केवल 4.74 > 4.47 (चित्र 9 की निचली तालिका देखें), पहले और दूसरे आपूर्तिकर्ता के बीच सांख्यिकीय रूप से महत्वपूर्ण अंतर मौजूद है। अन्य सभी जोड़ियों के पास नमूना साधन हैं जो हमें उनके मतभेदों के बारे में बात करने की अनुमति नहीं देते हैं। नतीजतन, पहले आपूर्तिकर्ता से खरीदे गए फाइबर से बुने गए पैराशूट की औसत ताकत दूसरे की तुलना में काफी कम है।

विचरण के एक-तरफ़ा विश्लेषण के लिए आवश्यक शर्तें

पैराशूट की ताकत की समस्या को हल करते समय, हमने यह जांच नहीं की कि क्या जिन परिस्थितियों में एक-कारक का उपयोग करना संभव है एफ-मानदंड. आप कैसे जानेंगे कि आप एक-कारक का उपयोग कर सकते हैं? एफविशिष्ट प्रयोगात्मक डेटा का विश्लेषण करते समय मानदंड? एकल कारक एफ-मानदंड केवल तभी लागू किया जा सकता है जब तीन बुनियादी धारणाएं पूरी हों: प्रयोगात्मक डेटा यादृच्छिक और स्वतंत्र होना चाहिए, सामान्य वितरण होना चाहिए, और उनके भिन्नताएं बराबर होनी चाहिए।

पहला अनुमान - यादृच्छिकता और डेटा स्वतंत्रता- हमेशा निष्पादित किया जाना चाहिए, क्योंकि किसी भी प्रयोग की शुद्धता पसंद की यादृच्छिकता और/या यादृच्छिकीकरण प्रक्रिया पर निर्भर करती है। परिणामों में पक्षपात से बचने के लिए यह आवश्यक है कि डेटा निकाला जाए साथसामान्य आबादी बेतरतीब ढंग से और एक दूसरे से स्वतंत्र रूप से। इसी तरह, डेटा को यादृच्छिक रूप से वितरित किया जाना चाहिए साथजिस कारक में हम रुचि रखते हैं उसके स्तर (प्रायोगिक समूह)। इन शर्तों का उल्लंघन विचरण के विश्लेषण के परिणामों को गंभीर रूप से विकृत कर सकता है।

दूसरा अनुमान - साधारण अवस्था- इसका मतलब है कि डेटा सामान्य रूप से वितरित आबादी से निकाला गया है। से संबंधित टी-मानदंड, विचरण का एकतरफ़ा विश्लेषण के आधार पर एफ-मानदंड इस शर्त के उल्लंघन के प्रति अपेक्षाकृत कम संवेदनशील है। यदि वितरण सामान्य से बहुत अधिक विचलन नहीं करता है, तो महत्व स्तर एफ-मानदंड थोड़ा बदलता है, खासकर यदि नमूना आकार काफी बड़ा है। यदि वितरण की सामान्यता की शर्त का गम्भीर उल्लंघन हो तो इसे लागू किया जाना चाहिए।

तीसरा अनुमान - विचरण की एकरूपता- इसका मतलब है कि प्रत्येक जनसंख्या के प्रसरण एक दूसरे के बराबर हैं (यानी σ 1 2 = σ 2 2 = ... = σ j 2)। यह धारणा किसी को यह निर्णय लेने की अनुमति देती है कि समूह के भीतर भिन्नताओं को अलग करना है या पूल करना है। यदि समूह का आकार समान है, तो विचरण की एकरूपता की स्थिति का उपयोग करके प्राप्त निष्कर्षों पर बहुत कम प्रभाव पड़ता है एफ-मानदंड। हालाँकि, यदि नमूना आकार असमान हैं, तो भिन्नता की समानता की स्थिति का उल्लंघन भिन्नता के विश्लेषण के परिणामों को गंभीर रूप से विकृत कर सकता है। इसलिए, यह सुनिश्चित करने का प्रयास किया जाना चाहिए कि नमूना आकार समान हों। विचरण की एकरूपता की धारणा की जाँच करने के तरीकों में से एक मानदंड है लेवेनेनीचे वर्णित।

यदि, तीनों शर्तों में से, केवल विचरण की एकरूपता की शर्त का उल्लंघन किया जाता है, तो एक प्रक्रिया समान होती है टी-अलग-अलग विचरण का उपयोग करते हुए मानदंड (अधिक जानकारी के लिए, देखें)। हालाँकि, यदि सामान्य वितरण और विचरण की एकरूपता की धारणाओं का एक साथ उल्लंघन किया जाता है, तो डेटा को सामान्य करना और भिन्नताओं के बीच अंतर को कम करना या एक गैरपैरामीट्रिक प्रक्रिया लागू करना आवश्यक है।

विचरण की एकरूपता के परीक्षण के लिए लेवेने का परीक्षण

हालांकि एफ-मानदंड समूहों में भिन्नताओं की समानता की स्थिति के उल्लंघन के प्रति अपेक्षाकृत प्रतिरोधी है; इस धारणा का घोर उल्लंघन मानदंड के महत्व और शक्ति के स्तर को महत्वपूर्ण रूप से प्रभावित करता है। शायद सबसे शक्तिशाली में से एक है कसौटी लेवेने. भिन्नताओं की समानता की जाँच करना साथसामान्य आबादी, हम निम्नलिखित परिकल्पनाओं का परीक्षण करेंगे:

Н 0: σ 1 2 = σ 2 2 = … = σजे 2

एच 1: सभी नहीं σ जे 2समान हैं ( जे = 1, 2, …, साथ)

संशोधित लेवेने का परीक्षण इस कथन पर आधारित है कि यदि समूहों में परिवर्तनशीलता समान है, तो अवलोकनों और समूह मध्यस्थों के बीच अंतर के निरपेक्ष मूल्यों के विचरण के विश्लेषण का उपयोग भिन्नताओं की समानता की शून्य परिकल्पना का परीक्षण करने के लिए किया जा सकता है। इसलिए, आपको पहले प्रत्येक समूह में अवलोकनों और मध्यस्थों के बीच अंतर के निरपेक्ष मूल्यों की गणना करनी चाहिए, और फिर अंतरों के परिणामी निरपेक्ष मूल्यों पर विचरण का एक-तरफ़ा विश्लेषण करना चाहिए। लेवेने की कसौटी को स्पष्ट करने के लिए, आइए नोट की शुरुआत में उल्लिखित परिदृश्य पर वापस लौटें। चित्र में प्रस्तुत डेटा का उपयोग करना। 6, हम एक समान विश्लेषण करेंगे, लेकिन प्रत्येक नमूने के लिए प्रारंभिक डेटा और माध्यकों में अंतर के मॉड्यूल के संबंध में अलग से (चित्र 11)।

भिन्नता का विश्लेषण। पाठ्यक्रम कार्य: विचरण विश्लेषण, विचरण का बहुभिन्नरूपी विश्लेषण

विचरण के विश्लेषण के प्रकार और मानदंड

कारकों

विचरण समस्याओं का विश्लेषण

वस्तु के एक प्रकार विश्लेषण

दो-कारक विश्लेषण

बहुभिन्नरूपी विश्लेषण

बार-बार प्रयोगों के साथ विचरण का बहुभिन्नरूपी विश्लेषण

विचरण के विश्लेषण का सामान्य विचार

विभिन्न प्रकार के खुराक रूपों के लिए गुणवत्ता कारकों के उदाहरण

टैबलेट निर्माण प्रक्रिया के दौरान अध्ययन किए गए गुणवत्ता कारकों और उनके स्तरों के उदाहरण

राज्य प्रतिस्पर्धात्मकता के स्तर के अध्ययन में विचरण विश्लेषण के मॉडल

भिन्नता का विश्लेषण

परिचयात्मक सिंहावलोकन

प्रमुख विचार

वर्गों के योग का विभाजन

विचरण का बहुभिन्नरूपी विश्लेषण

इंटरेक्शन प्रभाव

जटिल योजनाएँ

समूह के बीच और समूह के भीतर डिज़ाइन (बार-बार माप डिज़ाइन)

अपूर्ण (नेस्टेड) ​​योजनाएँ

सहप्रसरण विश्लेषण

मुख्य विचार

निश्चित सहसंयोजक

परिवर्तनशील सहसंयोजक

बहुभिन्नरूपी डिज़ाइन: विचरण और सहप्रसरण का बहुभिन्नरूपी विश्लेषण

अंतरसमूह योजनाएँ

बार-बार माप डिजाइन

परिवर्तनीय मानों का योग और विचरण का बहुभिन्नरूपी विश्लेषण

कंट्रास्ट विश्लेषण और पोस्ट हॉक परीक्षण

औसत के अलग-अलग सेटों की तुलना क्यों की जाती है?

विरोधाभासों का विश्लेषण

वापसतुलना

I, II, III और IV प्रकार के वर्गों का योग

बहुभिन्नरूपी प्रतिगमन और विचरण का विश्लेषण

असंतुलित एवं संतुलित योजनाएँ

I, II, III और IV प्रकार के वर्गों का योग

प्रकार I, II और III के वर्गों की परिकल्पना के योग की व्याख्या

मॉड्यूल में डिफ़ॉल्ट कम्प्यूटेशनल दृष्टिकोण भिन्नता का विश्लेषण

नियोजित तुलना

लुप्त कोशिकाओं वाली योजनाओं का विश्लेषण (अधूरी योजनाएँ)

प्रतिगमन दृष्टिकोण

सेल का अर्थ है, एनोवा दृष्टिकोण , टाइप IV परिकल्पनाएँ

गुम कोशिकाएं और विशिष्ट प्रभाव के लिए परीक्षण

गुम कोशिकाएं और एकत्रित प्रभाव/त्रुटि शर्तें

धारणाएँ और धारणाओं का उल्लंघन करने के प्रभाव

सामान्य वितरण की धारणा से विचलन

विचरण की एकरूपता

प्रसरण और सहप्रसरण की एकरूपता

गोलाकारता और जटिल समरूपता: विचरण के विश्लेषण में बार-बार माप के लिए बहुभिन्नरूपी दृष्टिकोण का उपयोग करने के कारण

विचरण और संरचनात्मक समीकरण मॉडलिंग का बहुभिन्नरूपी विश्लेषण

अपूर्ण (नेस्टेड) योजनाएँ