تحلیل واریانس. کار دوره: تحلیل واریانس تحلیل واریانس چند متغیره

تحلیل واریانس مجموعه‌ای از روش‌های آماری است که برای آزمون فرضیه‌های مربوط به رابطه بین ویژگی‌های خاص و عوامل مورد مطالعه که توصیف کمی ندارند و همچنین برای تعیین میزان تأثیر عوامل و تأثیر متقابل آنها طراحی شده‌اند. در ادبیات تخصصی اغلب ANOVA (از نام انگلیسی Analysis of Variations) نامیده می شود. این روش برای اولین بار توسط R. Fischer در سال 1925 توسعه یافت.

انواع و معیارهای تحلیل واریانس

از این روش برای بررسی رابطه بین ویژگی های کیفی (اسمی) و متغیر کمی (مستمر) استفاده می شود. در اصل، این فرضیه در مورد برابری میانگین های حسابی چند نمونه را آزمایش می کند. بنابراین می توان آن را به عنوان یک معیار پارامتریک برای مقایسه مرکز چند نمونه به طور همزمان در نظر گرفت. اگر از این روش برای دو نمونه استفاده شود، نتایج آنالیز واریانس با نتایج آزمون تی دانشجویی یکسان خواهد بود. با این حال، بر خلاف معیارهای دیگر، این مطالعه به ما اجازه می دهد تا مشکل را با جزئیات بیشتری بررسی کنیم.

تجزیه و تحلیل پراکندگی در آمار بر اساس قانون است: مجموع مجذور انحرافات نمونه ترکیبی برابر با مجذور انحرافات درون گروهی و مجذور انحرافات بین گروهی است. این مطالعه از آزمون فیشر برای تعیین اهمیت تفاوت بین واریانس های بین گروهی و واریانس های درون گروهی استفاده می کند. با این حال، پیش نیازهای لازم برای این امر، نرمال بودن توزیع و همسانی (برابری واریانس ها) نمونه ها است. تحلیل واریانس تک متغیره (تک عاملی) و چند متغیره (چند عاملی) وجود دارد. اولی وابستگی ارزش مورد مطالعه را به یک ویژگی در نظر می گیرد، دومی - به طور همزمان به بسیاری از آنها، و همچنین به ما امکان می دهد ارتباط بین آنها را شناسایی کنیم.

عوامل

عوامل شرایط کنترل شده ای هستند که بر نتیجه نهایی تأثیر می گذارند. سطح یا روش پردازش آن مقداری است که تجلی خاصی از این شرایط را مشخص می کند. این اعداد معمولاً در مقیاس اندازه گیری اسمی یا ترتیبی ارائه می شوند. اغلب مقادیر خروجی در مقیاس های کمی یا ترتیبی اندازه گیری می شوند. سپس مشکل گروه بندی داده های خروجی در تعدادی از مشاهدات که تقریباً با مقادیر عددی مشابهی مطابقت دارند، ایجاد می شود. اگر تعداد گروه ها بیش از حد زیاد در نظر گرفته شود، ممکن است تعداد مشاهدات در آنها برای به دست آوردن نتایج قابل اعتماد کافی نباشد. اگر تعداد را خیلی کوچک در نظر بگیرید، این می تواند منجر به از دست دادن ویژگی های قابل توجه تأثیر بر سیستم شود. روش خاص گروه بندی داده ها به مقدار و ماهیت تغییرات در مقادیر بستگی دارد. تعداد و اندازه بازه ها در تحلیل تک متغیره اغلب با اصل فواصل مساوی یا اصل فرکانس های برابر تعیین می شود.

تجزیه و تحلیل مشکلات واریانس

بنابراین، مواردی وجود دارد که شما نیاز به مقایسه دو یا چند نمونه دارید. پس از آن است که توصیه می شود از تجزیه و تحلیل واریانس استفاده کنید. نام روش نشان می دهد که نتیجه گیری بر اساس مطالعه مولفه های واریانس است. ماهیت مطالعه این است که تغییر کلی در شاخص به اجزای مؤلفه ای تقسیم می شود که با عملکرد هر عامل جداگانه مطابقت دارد. بیایید تعدادی از مسائل را در نظر بگیریم که با تحلیل واریانس معمولی حل می شوند.

مثال 1

این کارگاه دارای تعدادی دستگاه اتوماتیک است که قطعه خاصی را تولید می کند. اندازه هر قطعه یک متغیر تصادفی است که به تنظیمات هر دستگاه و انحرافات تصادفی که در طول فرآیند ساخت قطعات رخ می دهد بستگی دارد. لازم است بر اساس داده های اندازه گیری ابعاد قطعات مشخص شود که آیا ماشین ها به همین ترتیب پیکربندی شده اند یا خیر.

مثال 2

در ساخت یک دستگاه الکتریکی از انواع کاغذهای عایق خازن، برق و غیره استفاده می شود. دستگاه را می توان با مواد مختلفی آغشته کرد: رزین اپوکسی، لاک، رزین ML-2 و غیره. فشار بالا، با گرمایش. آغشته کردن را می توان با غوطه وری در لاک، زیر یک جریان مداوم لاک و غیره انجام داد. دستگاه الکتریکی به طور کلی با یک ترکیب خاص پر شده است که گزینه های مختلفی وجود دارد. شاخص های کیفیت عبارتند از استحکام الکتریکی عایق، دمای بیش از حد گرم شدن سیم پیچ در حالت کار، و تعدادی دیگر. در طول توسعه فرآیند فن آوری ساخت دستگاه ها، لازم است مشخص شود که هر یک از عوامل ذکر شده چگونه بر عملکرد دستگاه تأثیر می گذارد.

مثال 3

دپوی ترولی‌بوس چندین مسیر ترولی‌بوس را ارائه می‌کند. آنها از انواع مختلف ترولی بوس استفاده می کنند و 125 بازرس کرایه ها را جمع آوری می کنند. مدیریت انبار به این سوال علاقه مند است: چگونه می توان شاخص های اقتصادی کار هر کنترل کننده (درآمد) را با در نظر گرفتن مسیرهای مختلف و انواع مختلف ترولی بوس مقایسه کرد؟ چگونه می توان امکان سنجی اقتصادی تولید واگن برقی از یک نوع خاص در یک مسیر خاص را تعیین کرد؟ چگونه می توان الزامات معقولی را برای میزان درآمدی که یک هادی در هر مسیر در انواع مختلف ترولی بوس به ارمغان می آورد ایجاد کرد؟

وظیفه انتخاب یک روش چگونگی به دست آوردن حداکثر اطلاعات در مورد تأثیر هر عامل بر نتیجه نهایی، تعیین ویژگی های عددی چنین تأثیری، قابلیت اطمینان آنها با حداقل هزینه و در کوتاه ترین زمان ممکن است. روش های تحلیل واریانس امکان حل چنین مسائلی را فراهم می کند.

تحلیل تک متغیره

هدف از این مطالعه ارزیابی میزان تأثیر یک مورد خاص بر بررسی تحلیل شده است. هدف دیگر تحلیل تک متغیره ممکن است مقایسه دو یا چند موقعیت با یکدیگر برای تعیین تفاوت در تأثیر آنها بر یادآوری باشد. اگر فرضیه صفر رد شود، مرحله بعدی کمی سازی و ایجاد فاصله اطمینان برای ویژگی های به دست آمده است. در مواردی که نمی توان فرضیه صفر را رد کرد، معمولاً آن را پذیرفته و در مورد ماهیت تأثیر نتیجه گیری می شود.

تجزیه و تحلیل واریانس یک طرفه می تواند به یک آنالوگ ناپارامتری روش رتبه بندی کروسکال-والیس تبدیل شود. این معیار توسط ریاضیدان آمریکایی ویلیام کروسکال و اقتصاددان ویلسون والیس در سال 1952 ایجاد شد. این معیار برای آزمایش فرضیه صفر برابری اثرات بر روی نمونه های مورد مطالعه با مقادیر میانگین ناشناخته اما برابر طراحی شده است. در این حالت تعداد نمونه ها باید بیشتر از دو باشد.

معیار Jonckheere-Terpstra به طور مستقل توسط ریاضیدان هلندی T. J. Terpstra در سال 1952 و روانشناس بریتانیایی E. R. Jonckheere در سال 1954 پیشنهاد شد. این معیار زمانی استفاده می شود که از قبل مشخص شود که گروه های موجود نتایج بر اساس رشد تأثیرات مرتب شده اند. عامل مورد مطالعه که در مقیاس ترتیبی اندازه گیری می شود.

M - آزمون بارتلت، که توسط آماردان بریتانیایی موریس استیونسون بارتلت در سال 1937 ارائه شد، برای آزمون فرضیه صفر در مورد برابری واریانس چند جمعیت نرمال که نمونه های مورد مطالعه از آنها گرفته شده است استفاده می شود که معمولاً دارای اندازه های متفاوت هستند (تعداد هر یک). نمونه باید حداقل چهار باشد).

ز - آزمون کوکران که توسط ویلیام جمل کوکران آمریکایی در سال 1941 کشف شد. برای آزمون فرضیه صفر در مورد برابری واریانس جمعیت های نرمال در نمونه های مستقل با اندازه مساوی استفاده می شود.

آزمون ناپارامتری لوین که توسط ریاضیدان آمریکایی هاوارد لوین در سال 1960 پیشنهاد شد، جایگزینی برای آزمون بارتلت در شرایطی است که اطمینانی وجود ندارد که نمونه های مورد مطالعه مشمول توزیع نرمال هستند.

در سال 1974، آماردانان آمریکایی مورتون بی براون و آلن بی. فورسایت آزمونی (آزمون براون-فورسایث) را پیشنهاد کردند که کمی با آزمون لوین متفاوت است.

تحلیل دو عاملی

آنالیز واریانس دو طرفه برای نمونه‌های توزیع شده نرمال استفاده می‌شود. در عمل، جداول پیچیده این روش اغلب استفاده می شود، به ویژه آنهایی که در آنها هر سلول حاوی مجموعه ای از داده ها (اندازه گیری های مکرر) مربوط به مقادیر سطح ثابت است. اگر مفروضات مورد نیاز برای اعمال تحلیل واریانس دو طرفه برآورده نشدند، از آزمون ناپارامتریک رتبه فریدمن (فریدمن، کندال و اسمیت) استفاده کنید که توسط اقتصاددان آمریکایی میلتون فریدمن در اواخر سال 1930 ایجاد شد. این آزمون به نوع آن بستگی ندارد. توزیع

تنها فرض بر این است که توزیع مقادیر یکسان و پیوسته است و خود آنها مستقل از یکدیگر هستند. هنگام آزمایش فرضیه صفر، داده های خروجی به صورت یک ماتریس مستطیل شکل ارائه می شود که در آن ردیف ها با سطوح عامل B و ستون ها مربوط به سطوح A هستند. هر خانه از جدول (بلوک) می تواند باشد. نتیجه اندازه گیری پارامترها روی یک شی یا گروهی از اشیاء با مقادیر ثابت سطوح هر دو عامل. در این مورد، داده های مربوطه به عنوان مقادیر متوسط ​​یک پارامتر خاص برای تمام ابعاد یا اشیاء نمونه مورد مطالعه ارائه می شود. برای اعمال معیار خروجی باید از نتایج مستقیم اندازه گیری ها به رتبه آنها حرکت کرد. رتبه بندی برای هر ردیف به طور جداگانه انجام می شود، یعنی مقادیر برای هر مقدار ثابت مرتب می شوند.

آزمون پیج (آزمون L) که توسط آماردان آمریکایی E. B. Page در سال 1963 ارائه شد، برای آزمون فرضیه صفر طراحی شده است. برای نمونه های بزرگ، از تقریب Page استفاده می شود. آنها با توجه به واقعیت فرضیه های صفر مربوطه، از توزیع نرمال استاندارد تبعیت می کنند. در مواردی که سطرهای جدول منبع دارای مقادیر یکسانی هستند، لازم است از رتبه های متوسط ​​استفاده شود. در این صورت، دقت نتیجه گیری بدتر خواهد بود، هر چه تعداد چنین مسابقاتی بیشتر باشد.

س - معیار کوکران، پیشنهاد شده توسط دبلیو کوکران در سال 1937. این معیار در مواردی استفاده می‌شود که گروه‌هایی از افراد همگن در معرض تأثیراتی قرار می‌گیرند که تعداد آنها بیش از دو نفر است و برای آنها دو گزینه برای بازخورد ممکن است - مشروط منفی (0) و مشروط مثبت (1) . فرضیه صفر شامل برابری اثرات درمان است. تجزیه و تحلیل واریانس دو طرفه امکان تعیین وجود اثرات درمانی را فراهم می کند، اما تعیین اینکه این اثر برای کدام ستون های خاص وجود دارد را ممکن نمی سازد. برای حل این مشکل از روش معادلات چندگانه شفه برای نمونه های مرتبط استفاده شده است.

تحلیل چند متغیره

مشکل تحلیل واریانس چند متغیره زمانی به وجود می آید که شما نیاز به تعیین اثر دو یا چند شرط بر روی یک متغیر تصادفی خاص دارید. این مطالعه شامل وجود یک متغیر تصادفی وابسته است که در مقیاس تفاوت یا نسبت اندازه‌گیری می‌شود، و چندین متغیر مستقل که هر کدام در مقیاس نامگذاری یا رتبه‌بندی بیان می‌شوند. تجزیه و تحلیل واریانس داده ها بخش نسبتاً توسعه یافته ای از آمار ریاضی است که گزینه های زیادی دارد. مفهوم تحقیق برای هر دو تک عاملی و چند عاملی مشترک است. ماهیت آن در این واقعیت نهفته است که واریانس کل به اجزایی تقسیم می شود که مربوط به گروه بندی خاصی از داده ها است. هر گروه بندی داده مدل خاص خود را دارد. در اینجا ما فقط مقررات اساسی لازم برای درک و استفاده عملی از پرکاربردترین گزینه های آن را در نظر خواهیم گرفت.

تجزیه و تحلیل واریانس عوامل مستلزم یک نگرش نسبتاً دقیق به جمع آوری و ارائه داده های ورودی و به ویژه در تفسیر نتایج است. برخلاف آزمون تک عاملی که نتایج آن را می توان به صورت مشروط در یک توالی مشخص قرار داد، نتایج یک آزمون دو عاملی به ارائه پیچیده تری نیاز دارد. وقتی سه، چهار یا بیشتر شرایط وجود داشته باشد، وضعیت پیچیده‌تر می‌شود. به همین دلیل، گنجاندن بیش از سه (چهار) شرایط در یک مدل بسیار نادر است. به عنوان مثال، وقوع تشدید در مقدار مشخصی از خازن و اندوکتانس یک دایره الکتریکی است. تجلی یک واکنش شیمیایی با مجموعه خاصی از عناصر که سیستم از آن ساخته شده است. وقوع اثرات غیرعادی در سیستم های پیچیده تحت یک تصادف خاص از شرایط. وجود تعامل می تواند مدل سیستم را به طور اساسی تغییر دهد و گاهی منجر به تجدید نظر در ماهیت پدیده هایی شود که آزمایشگر با آنها سر و کار دارد.

تحلیل واریانس چند متغیره با آزمایش های مکرر

داده‌های اندازه‌گیری را اغلب می‌توان نه بر اساس دو، بلکه بر اساس تعداد بیشتری از عوامل گروه‌بندی کرد. بنابراین، اگر با در نظر گرفتن شرایط (کارخانه تولید و مسیری که لاستیک ها در آن کار می کنند)، تجزیه و تحلیل پراکندگی عمر مفید لاستیک های چرخ ترالی باس را در نظر بگیریم، می توانیم فصلی را که طی آن لاستیک ها در آن کار می کنند، به عنوان یک شرط جداگانه مشخص کنیم. تایرها کار می کنند (یعنی: کارکرد زمستانی و تابستانی). در نتیجه از روش سه عاملی مشکل خواهیم داشت.

در صورت وجود شرایط بیشتر، رویکرد همانند تحلیل دو عاملی است. در همه موارد سعی می کنند مدل را ساده کنند. پدیده تأثیر متقابل دو عامل چندان ظاهر نمی شود و تعامل سه گانه فقط در موارد استثنایی رخ می دهد. آن تعاملاتی را که اطلاعات قبلی و دلایل خوبی برای در نظر گرفتن آن در مدل وجود دارد، بگنجانید. فرآیند شناسایی عوامل فردی و در نظر گرفتن آنها نسبتاً ساده است. بنابراین، اغلب تمایل به برجسته کردن شرایط بیشتر وجود دارد. شما نباید از این موضوع غافل شوید. هر چه شرایط بیشتر باشد، مدل قابل اعتماد کمتر می شود و احتمال خطا بیشتر می شود. خود مدل که شامل تعداد زیادی متغیر مستقل است، برای تفسیر بسیار پیچیده و برای استفاده عملی ناخوشایند می شود.

ایده کلی تحلیل واریانس

تجزیه و تحلیل واریانس در آمار روشی برای به دست آوردن نتایج مشاهداتی وابسته به شرایط مختلف عملیاتی به طور همزمان و ارزیابی تأثیر آنها است. متغیر کنترل شده ای که با روش تأثیرگذاری بر موضوع مطالعه مطابقت دارد و در یک بازه زمانی معین مقدار معینی به دست می آورد، عامل نامیده می شود. آنها می توانند کیفی و کمی باشند. سطوح شرایط کمی معنای خاصی در مقیاس عددی به دست می آورند. مثلا دما، فشار فشار، مقدار ماده. عوامل کیفی مواد مختلف، روش های مختلف تکنولوژیکی، دستگاه ها، پرکننده ها هستند. سطوح آنها با مقیاسی از نام ها مطابقت دارد.

کیفیت همچنین می تواند شامل نوع مواد بسته بندی و شرایط نگهداری فرم دوز باشد. همچنین منطقی است که درجه آسیاب مواد خام، ترکیب کسری گرانول ها را نیز لحاظ کنیم، که اهمیت کمی دارند، اما در صورت استفاده از مقیاس کمی، تنظیم آن دشوار است. تعداد عوامل کیفی به نوع شکل دارویی و همچنین خواص فیزیکی و تکنولوژیکی مواد دارویی بستگی دارد. به عنوان مثال، قرص ها را می توان از مواد کریستالی با فشرده سازی مستقیم به دست آورد. در این مورد، کافی است مواد کشویی و روان کننده را انتخاب کنید.

نمونه هایی از فاکتورهای کیفیت برای انواع مختلف اشکال دارویی

  • تنتور.ترکیب عصاره گیری، نوع استخراج، روش تهیه مواد اولیه، روش تولید، روش فیلتراسیون.
  • عصاره ها (مایع، غلیظ، خشک).ترکیب استخراج کننده، روش استخراج، نوع نصب، روش حذف مواد استخراج کننده و بالاست.
  • قرص.ترکیبات کمکی، پرکننده ها، مواد تجزیه کننده، چسباننده ها، روان کننده ها و روان کننده ها. روش تهیه تبلت، نوع تجهیزات فناورانه. نوع پوسته و اجزای آن، فیلم سازها، رنگدانه ها، رنگ ها، نرم کننده ها، حلال ها.
  • محلول های تزریقینوع حلال، روش فیلتراسیون، ماهیت تثبیت کننده ها و نگهدارنده ها، شرایط استریلیزاسیون، روش پرکردن آمپول.
  • شیاف.ترکیب پایه شیاف، روش تولید شیاف، پرکننده، بسته بندی.
  • پمادها.ترکیب پایه، اجزای ساختاری، روش تهیه پماد، نوع تجهیزات، بسته بندی.
  • کپسول.نوع مواد پوسته، روش تولید کپسول، نوع نرم کننده، نگهدارنده، رنگ.
  • لمینت هاروش تهیه، ترکیب، نوع تجهیزات، نوع امولسیفایر.
  • سیستم های تعلیق.نوع حلال، نوع تثبیت کننده، روش پراکندگی.

نمونه هایی از فاکتورهای کیفیت و سطوح آنها در طول فرآیند تولید تبلت مورد مطالعه قرار گرفت

  • پودر خمیرمایه.نشاسته سیب زمینی، خاک رس سفید، مخلوطی از بی کربنات سدیم با اسید سیتریک، کربنات منیزیم بازی.
  • محلول اتصال.آب، خمیر نشاسته، شربت قند، محلول متیل سلولز، محلول هیدروکسی پروپیل متیل سلولز، محلول پلی وینیل پیرولیدون، محلول پلی وینیل الکل.
  • ماده کشویی.آئروسیل، نشاسته، تالک.
  • پرکننده.قند، گلوکز، لاکتوز، کلرید سدیم، فسفات کلسیم.
  • روان کننده.اسید استئاریک، پلی اتیلن گلیکول، پارافین.

مدل های تحلیل واریانس در مطالعه سطح رقابت پذیری دولت

یکی از مهمترین معیارهای ارزیابی وضعیت یک دولت که بر اساس آن سطح رفاه و توسعه اجتماعی-اقتصادی آن ارزیابی می شود، رقابت پذیری است، یعنی مجموعه ای از ویژگی های ذاتی اقتصاد ملی که تعیین کننده وضعیت دولت است. توانایی رقابت با سایر کشورها با تعیین مکان و نقش دولت در بازار جهانی، می توان یک استراتژی روشن برای تضمین امنیت اقتصادی در مقیاس بین المللی ایجاد کرد، زیرا این کلید روابط مثبت بین روسیه و همه بازیگران در بازار جهانی است: سرمایه گذاران. ، طلبکاران و دولت ها.

برای مقایسه سطح رقابت پذیری کشورها، کشورها با استفاده از شاخص های پیچیده ای که شامل شاخص های وزنی مختلف است، رتبه بندی می شوند. این شاخص ها بر اساس عوامل کلیدی موثر بر وضعیت اقتصادی، سیاسی و ... است. مجموعه ای از مدل ها برای مطالعه رقابت پذیری دولت شامل استفاده از روش های تحلیل آماری چند متغیره (به ویژه، تحلیل واریانس (آمار)، مدل سازی اقتصادسنجی، تصمیم گیری) و شامل مراحل اصلی زیر است:

  1. تشکیل یک سیستم شاخص.
  2. ارزیابی و پیش بینی شاخص های رقابت پذیری دولت.
  3. مقایسه شاخص های رقابت پذیری کشورها.

حال بیایید نگاهی به محتوای مدل های هر یک از مراحل این مجموعه داشته باشیم.

در مرحله اولبا استفاده از روش های مطالعه کارشناسی، مجموعه ای مستدل از شاخص های اقتصادی برای ارزیابی رقابت پذیری دولت با در نظر گرفتن ویژگی های توسعه آن بر اساس رتبه بندی های بین المللی و داده های بخش های آماری شکل می گیرد که وضعیت سیستم را به طور کلی منعکس می کند. و فرآیندهای آن انتخاب این شاخص ها با نیاز به انتخاب مواردی توجیه می شود که به طور کامل از نقطه نظر عملی به ما امکان می دهد سطح دولت ، جذابیت سرمایه گذاری آن و امکان بومی سازی نسبی تهدیدات بالقوه و بالفعل موجود را تعیین کنیم.

شاخص های اصلی سیستم های رتبه بندی بین المللی شاخص ها هستند:

  1. رقابت جهانی (GC).
  2. آزادی اقتصادی (IES).
  3. توسعه انسانی (HDI).
  4. تصورات فساد (CPC).
  5. تهدیدات داخلی و خارجی (IETH).
  6. پتانسیل نفوذ بین المللی (IPIP).

فاز دومارزیابی و پیش‌بینی شاخص‌های رقابت‌پذیری دولت را بر اساس رتبه‌بندی‌های بین‌المللی برای 139 کشور مورد مطالعه جهان فراهم می‌کند.

مرحله سوممقایسه شرایط رقابتی دولت ها با استفاده از روش های همبستگی و تحلیل رگرسیون فراهم می کند.

با استفاده از نتایج مطالعه، می توان ماهیت فرآیندها را به طور کلی و برای اجزای فردی رقابت پذیری دولت تعیین کرد. فرضیه تأثیر عوامل و روابط آنها را در سطح مناسبی از اهمیت آزمایش کنید.

اجرای مجموعه مدل های پیشنهادی نه تنها امکان ارزیابی وضعیت فعلی سطح رقابت پذیری و جذابیت سرمایه گذاری دولت ها را فراهم می کند، بلکه به تجزیه و تحلیل کاستی های مدیریتی، جلوگیری از اشتباهات تصمیمات اشتباه و جلوگیری از توسعه بحران در کشور می پردازد. حالت.

تحلیل واریانس

1. مفهوم تحلیل واریانس

تحلیل واریانستجزیه و تحلیل تغییرپذیری یک صفت تحت تأثیر هر عامل متغیر کنترل شده است. در ادبیات خارجی، تجزیه و تحلیل واریانس اغلب به عنوان ANOVA شناخته می شود که به عنوان تجزیه و تحلیل متغیر (Analysis of Variance) ترجمه می شود.

مشکل ANOVAشامل جداسازی تنوع از نوع متفاوت از تغییرپذیری عمومی یک صفت است:

الف) تغییرپذیری ناشی از عملکرد هر یک از متغیرهای مستقل مورد مطالعه؛

ب) تغییرپذیری ناشی از تعامل متغیرهای مستقل مورد مطالعه؛

ج) تنوع تصادفی ناشی از همه متغیرهای ناشناخته دیگر.

تغییرپذیری ناشی از عملکرد متغیرهای مورد مطالعه و اثر متقابل آنها با متغیرهای تصادفی همبستگی دارد. شاخص این رابطه آزمون F فیشر است.

فرمول محاسبه معیار F شامل برآوردهای واریانس، یعنی پارامترهای توزیع صفت است، بنابراین معیار F یک معیار پارامتریک است.

هر چه تغییرپذیری یک صفت به دلیل متغیرها (عوامل) مورد مطالعه یا اثر متقابل آنها باشد، بالاتر است. مقادیر معیار تجربی.

صفر فرضیه در تحلیل واریانس بیان می‌کند که مقادیر میانگین مشخصه مؤثر مورد مطالعه در همه درجه‌بندی‌ها یکسان است.

جایگزین فرضیه بیان خواهد کرد که مقادیر میانگین مشخصه حاصل در درجه بندی های مختلف عامل مورد مطالعه متفاوت است.

تجزیه و تحلیل واریانس به ما امکان می دهد تغییری را در یک مشخصه بیان کنیم، اما نشان نمی دهد جهتاین تغییرات.

بیایید بررسی خود را در مورد تحلیل واریانس با ساده ترین حالت شروع کنیم، زمانی که عمل تنها را مطالعه می کنیم یکیمتغیر (یک عامل).

2. تجزیه و تحلیل واریانس یک طرفه برای نمونه های نامرتبط

2.1. هدف روش

روش تحلیل واریانس تک عاملی در مواردی استفاده می شود که تغییرات در یک مشخصه مؤثر تحت تأثیر شرایط متغیر یا درجه بندی یک عامل مورد مطالعه قرار گیرد. در این نسخه از روش، تأثیر هر یک از درجه بندی های عامل است ناهمساننمونه هایی از موضوعات حداقل باید سه درجه بندی از فاکتور وجود داشته باشد. (ممکن است دو درجه بندی وجود داشته باشد، اما در این صورت نمی توانیم وابستگی های غیرخطی ایجاد کنیم و استفاده از وابستگی های ساده تر معقول تر به نظر می رسد).

نسخه ناپارامتریک این نوع تحلیل، آزمون کروسکال-والیس H است.

فرضیه ها

H 0: تفاوت بین درجه های عامل (شرایط مختلف) بیشتر از تفاوت های تصادفی در هر گروه نیست.

H 1: تفاوت بین درجه های عامل (شرایط مختلف) بیشتر از تفاوت های تصادفی در هر گروه است.

2.2. محدودیت های تحلیل واریانس یک طرفه برای نمونه های نامرتبط

1. تحلیل واریانس یک طرفه به حداقل سه درجه بندی عامل و حداقل دو آزمودنی در هر درجه بندی نیاز دارد.

2. مشخصه به دست آمده باید به طور معمول در نمونه مورد مطالعه توزیع شود.

درست است، معمولاً مشخص نمی شود که آیا ما در مورد توزیع مشخصه در کل نمونه بررسی شده صحبت می کنیم یا در بخشی از آن که مجموعه پراکندگی را تشکیل می دهد.

3. مثالی از حل مسئله با استفاده از روش آنالیز واریانس یک طرفه برای نمونه های نامرتبط با استفاده از مثال:

به سه گروه مختلف از شش آزمودنی فهرستهای ده کلمه ای داده شد. کلمات به گروه اول با سرعت کم - 1 کلمه در 5 ثانیه، به گروه دوم با سرعت متوسط ​​- 1 کلمه در 2 ثانیه و به گروه سوم با سرعت بالا - 1 کلمه در ثانیه ارائه شد. عملکرد بازتولید به سرعت ارائه کلمه بستگی دارد. نتایج در جدول ارائه شده است. 1.

تعداد کلمات تکثیر شده میز 1

موضوع شماره

سرعت کم

سرعت متوسط

سرعت بالا

مبلغ کل

H 0: تفاوت در طول تولید کلمه بینگروه ها بیشتر از تفاوت های تصادفی مشخص نیستند داخلهر گروه

H1: تفاوت در حجم تولید کلمه بینگروه ها بیشتر از تفاوت های تصادفی هستند داخلهر گروه با استفاده از مقادیر تجربی ارائه شده در جدول. 1، مقادیری را تعیین می کنیم که برای محاسبه معیار F لازم است.

محاسبه مقادیر اصلی برای تحلیل واریانس یک طرفه در جدول ارائه شده است:

جدول 2

جدول 3

دنباله ای از عملیات در آنالیز واریانس یک طرفه برای نمونه های نامرتبط

نام SS که اغلب در این جدول و جداول بعدی یافت می‌شود، مخفف «مجموع مربع‌ها» است. این مخفف بیشتر در منابع ترجمه شده استفاده می شود.

اس اس حقیقتبه معنای تغییرپذیری ویژگی به دلیل عملکرد عامل مورد مطالعه است.

اس اس بطور کلی- تنوع کلی صفت؛

اس سی.ای.-تغییرپذیری ناشی از عوامل محاسبه نشده، تنوع "تصادفی" یا "باقیمانده".

ام‌اس- "میانگین مربع" یا انتظار ریاضی از مجموع مربع ها، مقدار متوسط ​​SS مربوطه.

df - تعداد درجات آزادی که هنگام در نظر گرفتن معیارهای ناپارامتری، آن را با یک حرف یونانی نشان می دهیم. v.

نتیجه گیری: H 0 رد می شود. H 1 پذیرفته می شود. تفاوت در یادآوری کلمات بین گروه ها بیشتر از تفاوت های تصادفی در هر گروه بود (05/0=α). بنابراین سرعت ارائه کلمات بر حجم بازتولید آنها تأثیر می گذارد.

نمونه ای از حل مشکل در اکسل در زیر ارائه شده است:

اطلاعات اولیه:

با استفاده از دستور: Tools->Data Analysis->One-way ANOVA، نتایج زیر را دریافت می کنیم:

تکنیک های مورد بحث در بالا برای آزمون فرضیه های آماری در مورد اهمیت تفاوت بین دو میانگین در عمل کاربرد محدودی دارند. این به این دلیل است که به منظور شناسایی تأثیر همه شرایط و عوامل ممکن بر یک صفت مؤثر، آزمایش‌های مزرعه‌ای و آزمایشگاهی معمولاً با استفاده از دو نمونه، بلکه تعداد بیشتری از نمونه‌ها (1220 یا بیشتر) انجام می‌شود. ).

اغلب محققان میانگین چند نمونه ترکیب شده را در یک مجتمع مقایسه می کنند. به عنوان مثال، هنگام مطالعه تأثیر انواع و دوزهای مختلف کود بر عملکرد محصول، آزمایش ها در نسخه های مختلف تکرار می شوند. در این موارد، مقایسه های زوجی دست و پا گیر می شود و تحلیل آماری کل مجموعه مستلزم استفاده از روش خاصی است. این روش که در آمار ریاضی توسعه یافته است، آنالیز واریانس نامیده می شود. برای اولین بار توسط آماردان انگلیسی R. Fisher هنگام پردازش نتایج آزمایشات زراعی (1938) استفاده شد.

تحلیل واریانسروشی برای ارزیابی آماری پایایی تظاهر وابستگی یک ویژگی مؤثر به یک یا چند عامل است. با استفاده از روش تحلیل واریانس، فرضیه های آماری در رابطه با میانگین ها در چند جمعیت عمومی که دارای توزیع نرمال هستند مورد آزمون قرار می گیرند.

تحلیل واریانس یکی از روش های اصلی برای ارزیابی آماری نتایج تجربی است. همچنین به طور فزاینده ای در تجزیه و تحلیل اطلاعات اقتصادی استفاده می شود. تجزیه و تحلیل واریانس این امکان را فراهم می کند تا مشخص شود که تا چه حد شاخص های نمونه از رابطه بین ویژگی های حاصل و عامل برای گسترش داده های به دست آمده از نمونه به جامعه عمومی کافی است. مزیت این روش این است که نتایج نسبتاً قابل اعتمادی از نمونه های کوچک به دست می دهد.

با مطالعه تغییرات یک مشخصه مؤثر تحت تأثیر یک یا چند عامل با استفاده از تحلیل واریانس، می‌توان علاوه بر برآوردهای کلی از اهمیت وابستگی‌ها، ارزیابی تفاوت‌های بزرگی میانگین‌های شکل‌گرفته را نیز به دست آورد. در سطوح مختلف عوامل، و اهمیت اثر متقابل عوامل. از تحلیل واریانس برای مطالعه وابستگی های هر دو ویژگی کمی و کیفی و همچنین ترکیب آنها استفاده می شود.

ماهیت این روش مطالعه آماری احتمال تأثیر یک یا چند عامل و همچنین تأثیر متقابل آنها بر ویژگی حاصل است. بر این اساس، سه کار اصلی با استفاده از تحلیل واریانس حل می شود: 1) ارزیابی کلی از اهمیت تفاوت بین میانگین های گروه. 2) ارزیابی احتمال تعامل بین عوامل. 3) ارزیابی اهمیت تفاوت بین جفت میانگین. در اغلب موارد، هنگامی که تأثیر چندین عامل بر یک صفت مؤثر مورد مطالعه قرار می‌گیرد، محققان مجبورند چنین مشکلاتی را هنگام انجام آزمایش‌های میدانی و زئوتکنیکی حل کنند.

طرح اصلی تحلیل واریانس شامل تعیین منابع اصلی تغییر در مشخصه مؤثر و تعیین حجم تغییرات (مجموع انحرافات مجذور) با توجه به منابع تشکیل آن است. تعیین تعداد درجات آزادی متناظر با اجزای کل تغییرات؛ محاسبه پراکندگی ها به عنوان نسبت حجم تغییرات مربوطه به تعداد درجات آزادی آنها. تجزیه و تحلیل رابطه بین واریانس؛ ارزیابی پایایی تفاوت بین میانگین ها و نتیجه گیری.

این طرح هم در مدل‌های ساده تحلیل واریانس، زمانی که داده‌ها بر اساس یک مشخصه گروه‌بندی می‌شوند، و هم در مدل‌های پیچیده، زمانی که داده‌ها بر اساس دو یا چند ویژگی گروه‌بندی می‌شوند، حفظ می‌شود. با این حال، با افزایش تعداد ویژگی های گروه، روند تجزیه کل تغییرات با توجه به منابع تشکیل آن پیچیده تر می شود.

بر اساس نمودار اصلی، تحلیل واریانس را می توان در قالب پنج مرحله متوالی نشان داد:

1) تعریف و بسط تنوع؛

2) تعیین تعداد درجات آزادی تنوع.

3) محاسبه واریانس و نسبت آنها.

4) تجزیه و تحلیل واریانس ها و روابط آنها.

5) ارزیابی اهمیت تفاوت بین میانگین ها و نتیجه گیری برای آزمون فرضیه صفر.

پر زحمت ترین بخش تحلیل واریانس مرحله اول است - تعیین و تجزیه تغییرات با توجه به منابع تشکیل آن. ترتیب تجزیه حجم کل تغییرات به تفصیل در فصل 5 مورد بحث قرار گرفت.

مبنای حل مسائل تحلیل واریانس، قانون تغییرات بسط (افزودن) است که بر اساس آن کل تغییرات (نوسانات) صفت حاصل به دو قسمت تقسیم می شود: تغییرات ناشی از عمل عامل(های) مورد مطالعه. و تنوع ناشی از عمل علل تصادفی، یعنی

فرض کنید جمعیت مورد مطالعه بر اساس ویژگی های عاملی به چند گروه تقسیم می شود که هر یک از آنها با مقدار متوسط ​​مشخصه حاصل مشخص می شود. در عین حال، تغییر این مقادیر را می توان با دو نوع دلیل توضیح داد: دلایلی که به طور سیستماتیک روی علامت مؤثر عمل می کنند و می توانند در طول آزمایش تنظیم شوند و مواردی که قابل تنظیم نیستند. بدیهی است که تغییرات بین گروهی (عاملی یا سیستماتیک) در درجه اول به عملکرد عامل مورد مطالعه بستگی دارد و تغییرات درون گروهی (باقیمانده یا تصادفی) در درجه اول به عملکرد عوامل تصادفی بستگی دارد.

برای ارزیابی پایایی تفاوت‌های میانگین‌های گروهی، لازم است تغییرات بین گروهی و درون گروهی تعیین شود. اگر تغییرات بین گروهی (عاملی) به طور قابل توجهی از تغییرات درون گروهی (باقیمانده) فراتر رود، این عامل بر ویژگی حاصل تأثیر می گذارد و به طور قابل توجهی مقادیر میانگین های گروه را تغییر می دهد. اما این سوال مطرح می شود که چه رابطه ای بین تغییرات درون گروهی و درون گروهی وجود دارد که می توان آن را برای نتیجه گیری پایایی (معنادار بودن) تفاوت بین میانگین های گروهی کافی دانست؟

برای ارزیابی اهمیت تفاوت بین میانگین ها و تدوین نتیجه گیری برای آزمون فرضیه صفر (H0:x1 = x2 =... = xn) در تحلیل واریانس، از نوعی استاندارد استفاده می شود - معیار G، قانون توزیع که توسط R. Fisher تاسیس شد. این معیار نسبت دو واریانس است: فاکتوریل، ایجاد شده توسط عمل عامل مورد مطالعه، و باقیمانده، به دلیل عملکرد علل تصادفی:

رابطه پراکندگی Γ = £>u : Snedecor آماردان آمریکایی پیشنهاد کرد که به افتخار مخترع آنالیز واریانس، R. Fisher، £*2 را با حرف G نشان دهیم.

واریانس °2 io2 تخمینی از واریانس جمعیت است. اگر نمونه‌هایی با واریانس 2°2 از یک جامعه عمومی ساخته شده باشند، که در آن تغییرات مقادیر تصادفی بوده است، اختلاف در مقادیر 2°2 نیز تصادفی است.

اگر آزمایشی تأثیر چندین عامل (A، B، C و غیره) را بر روی یک صفت مؤثر به طور همزمان آزمایش کند، واریانس ناشی از عمل هر یک از آنها باید قابل مقایسه با °e.gP، به این معنا که

اگر مقدار پراکندگی عامل به طور قابل توجهی بیشتر از باقیمانده باشد، آن ضریب به طور قابل توجهی بر ویژگی حاصل تأثیر می گذارد و بالعکس.

در آزمایش‌های چندعاملی، علاوه بر تغییرات ناشی از عمل هر عامل، تقریباً همیشه تغییرات ناشی از اثر متقابل عوامل وجود دارد ($ав: ^лс ^вс $ліс). ماهیت تعامل این است که اثر یک عامل به طور قابل توجهی در سطوح مختلف دوم تغییر می کند (به عنوان مثال، اثربخشی کیفیت خاک در دوزهای مختلف کود).

تعامل عوامل نیز باید با مقایسه واریانس های مربوطه ارزیابی شود 3^v.gr:

هنگام محاسبه مقدار واقعی معیار B، بزرگتر واریانس ها در صورتگر گرفته می شود، بنابراین B> 1. بدیهی است که هر چه معیار B بزرگتر باشد، تفاوت بین واریانس ها بیشتر است. اگر B = 1، سؤال ارزیابی اهمیت تفاوت در واریانس ها حذف می شود.

برای تعیین حدود نوسانات تصادفی در نسبت پراکندگی، G. Fischer جداول B-توزیع ویژه ای را توسعه داد (پیوست های 4 و 5). این معیار از نظر عملکردی با احتمال مرتبط است و به تعداد درجات آزادی تغییرات بستگی دارد k1و k2 از دو واریانس مقایسه شدند. به طور معمول، از دو جدول برای نتیجه گیری در مورد ارزش بسیار بالای معیار برای سطوح معنی داری 0.05 و 0.01 استفاده می شود. سطح معنی داری 0.05 (یا 5%) به این معنی است که تنها در 5 مورد از 100 معیار B می تواند مقداری برابر یا بالاتر از آنچه در جدول نشان داده شده است به دست آورد. کاهش سطح معناداری از 0.05 به 0.01 منجر به افزایش مقدار معیار بین دو واریانس به دلیل تأثیر تنها دلایل تصادفی می شود.

مقدار معیار همچنین به طور مستقیم به تعداد درجات آزادی دو پراکندگی مورد مقایسه بستگی دارد. اگر تعداد درجات آزادی به بی نهایت (k-me) تمایل داشته باشد، نسبت B برای دو پراکندگی به وحدت گرایش دارد.

مقدار جدول بندی شده معیار B مقدار تصادفی احتمالی نسبت دو واریانس را در سطح معنی داری معین و تعداد متناظر درجه آزادی را برای هر یک از واریانس های مورد مقایسه نشان می دهد. جداول نشان داده شده مقدار B را برای نمونه های ساخته شده از یک جامعه عمومی نشان می دهد، که در آن دلایل تغییرات مقادیر فقط تصادفی است.

مقدار Γ از جداول (ضمائم 4 و 5) در تقاطع ستون مربوطه (تعداد درجه آزادی برای پراکندگی بیشتر - k1) و ردیف (تعداد درجه آزادی برای پراکندگی کمتر - k2) یافت می شود. ). بنابراین، اگر واریانس بزرگتر (عدد Г) k1 = 4، و واریانس کوچکتر (مخرج Г) k2 = 9 باشد، آنگاه Г در سطح معناداری 0.05 = 3.63 خواهد بود (پیوست 4). بنابراین، در نتیجه علل تصادفی، از آنجایی که نمونه ها کوچک هستند، واریانس یک نمونه می تواند در سطح معنی داری 5 درصد، 3.63 برابر واریانس نمونه دوم بیشتر شود. هنگامی که سطح معنی داری از 0.05 به 0.01 کاهش یابد، مقدار جدولی معیار G همانطور که در بالا ذکر شد افزایش می یابد. بنابراین، با همان درجات آزادی k1 = 4 و k2 = 9 و a = 0.01، مقدار جدول بندی شده معیار G برابر 6.99 خواهد بود (پیوست 5).

بیایید روش تعیین تعداد درجات آزادی در تحلیل واریانس را در نظر بگیریم. تعداد درجات آزادی، که با مجموع مجذور انحرافات مطابقت دارد، به اجزای مربوطه تجزیه می شود، مشابه تجزیه مجموع انحرافات مجذور (^total = No^gr + ]¥vhr)، یعنی تعداد کل درجات آزادی (k") به تعداد درجات آزادی برای تغییرات بین گروهی (k1) و درون گروهی (k2) تجزیه می شود.

بنابراین، اگر جامعه نمونه متشکل از نمشاهدات تقسیم بر تی گروه ها (تعداد گزینه های آزمایشی) و پ زیر گروه ها (تعداد تکرارها)، سپس تعداد درجات آزادی k بر این اساس خواهد بود:

الف) برای مجموع مجذور انحرافات (s7zag)

ب) برای مجموع مجذور انحرافات بین گروهی ^m.gP)

ج) برای مجموع مجذور انحرافات درون گروهی V v.gR)

طبق قانون اضافه کردن تغییرات:

به عنوان مثال، اگر در یک آزمایش چهار نوع آزمایش تشکیل شده باشد (t = 4) در هر پنج تکرار (n = 5)، و تعداد کل مشاهدات N = = باشد. تی o p = 4 * 5 = 20، سپس تعداد درجات آزادی به ترتیب برابر است با:

با دانستن مجموع انحرافات مجذور و تعداد درجات آزادی، می‌توانیم تخمین‌های بی‌طرف (تصحیح) را برای سه واریانس تعیین کنیم:

فرضیه صفر H0 با استفاده از معیار B به همان روشی که با استفاده از آزمون t Student مورد آزمایش قرار می گیرد. برای تصمیم گیری در مورد بررسی H0، لازم است مقدار واقعی معیار محاسبه شود و آن را با مقدار جدول Ba برای سطح اهمیت پذیرفته شده a و تعداد درجات آزادی مقایسه کنید. k1و k2 برای دو پراکندگی.

اگر Bfaq > Ba، مطابق با سطح معنی‌داری پذیرفته شده، می‌توان نتیجه گرفت که تفاوت در واریانس‌های نمونه نه تنها توسط عوامل تصادفی تعیین می‌شود. قابل توجه هستند. در این مورد، فرضیه صفر رد می شود و دلیلی وجود دارد که ادعا کنیم این عامل به طور قابل توجهی بر ویژگی حاصل تأثیر می گذارد. اگر< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

استفاده از یک مدل تحلیل واریانس خاص هم به تعداد عوامل مورد مطالعه و هم به روش نمونه گیری بستگی دارد.

ج بسته به تعداد عواملی که تغییر مشخصه حاصل را تعیین می کنند، نمونه ها را می توان با توجه به یک، دو یا چند عامل تشکیل داد. بر این اساس تحلیل واریانس به تک عاملی و چند عاملی تقسیم می شود. در غیر این صورت به آن کمپلکس پراکندگی تک عاملی و چند عاملی نیز می گویند.

طرح تجزیه تغییرات کل به تشکیل گروه ها بستگی دارد. می تواند تصادفی (مشاهدات یک گروه با مشاهدات گروه دوم ارتباطی ندارد) و غیرتصادفی (مشاهدات دو نمونه با شرایط آزمایشی مشترک با یکدیگر مرتبط هستند). بر این اساس نمونه های مستقل و وابسته به دست می آیند. نمونه های مستقل را می توان با اعداد مساوی و ناهموار تشکیل داد. تشکیل نمونه های وابسته اندازه مساوی آنها را فرض می کند.

اگر گروه ها به ترتیب تصادفی تشکیل شوند، حجم کل تغییرات صفت حاصل، همراه با تغییر فاکتوریل (بین گروهی) و باقیمانده، شامل تغییرات تکرارها می شود، یعنی

در عمل، در بیشتر موارد، زمانی که شرایط برای گروه‌ها و زیر گروه‌ها برابر است، لازم است نمونه‌های وابسته در نظر گرفته شوند. بنابراین، در یک آزمایش میدانی، کل سایت به بلوک‌هایی با متنوع‌ترین شرایط تقسیم می‌شود. در این مورد، هر نوع آزمایش فرصت‌های برابری برای نمایش در همه بلوک‌ها دریافت می‌کند، در نتیجه شرایط برای همه انواع آزمایش‌شده آزمایش برابر می‌شود. این روش ساخت آزمایش را روش بلوک تصادفی می نامند. آزمایشات با حیوانات نیز به همین ترتیب انجام می شود.

هنگام پردازش داده های اجتماعی-اقتصادی با استفاده از روش تحلیل واریانس، باید در نظر داشت که به دلیل تعداد زیاد عوامل و ارتباط متقابل آنها، تعیین درجه هدف، حتی با دقیق ترین سطح بندی شرایط، دشوار است. تأثیر هر عامل جداگانه بر ویژگی حاصل. بنابراین، سطح تغییرات باقیمانده نه تنها با علل تصادفی، بلکه توسط عوامل مهمی که در ساخت مدل تحلیل واریانس در نظر گرفته نشده‌اند، تعیین می‌شود. در نتیجه، واریانس باقیمانده به عنوان مبنایی برای مقایسه، گاهی برای هدف خود ناکافی می شود؛ به وضوح از نظر ارزش بیش از حد برآورد می شود و نمی تواند به عنوان معیاری برای اهمیت تأثیر عوامل عمل کند. در این راستا، هنگام ساخت مدل های تحلیل واریانس، مسئله انتخاب مهم ترین عوامل و تراز کردن شرایط برای تجلی عمل هر یک از آنها مطرح می شود. بعلاوه. استفاده از تحلیل واریانس، توزیع نرمال یا نزدیک به نرمال جمعیت های آماری مورد مطالعه را فرض می کند. اگر این شرط برآورده نشود، تخمین های به دست آمده در تحلیل واریانس اغراق آمیز خواهد بود.

یک فرد تنها با تلاش برای به کارگیری توانایی های خود می تواند آن ها را تشخیص دهد. (سنکا)

تحلیل واریانس

نمای کلی مقدماتی

در این بخش، روش ها، مفروضات و اصطلاحات پایه ANOVA را بررسی می کنیم.

توجه داشته باشید که در ادبیات انگلیسی زبان، تحلیل واریانس معمولاً آنالیز تنوع نامیده می شود. بنابراین، برای اختصار، در زیر گاهی اوقات از این اصطلاح استفاده خواهیم کرد ANOVA (یکتجزیه و تحلیل o f واریشن) برای ANOVA معمولی و مدت مانوابرای تحلیل واریانس چند متغیره در این بخش به صورت متوالی ایده های اصلی تحلیل واریانس ( ANOVAتجزیه و تحلیل کوواریانس ( ANCOVAتجزیه و تحلیل واریانس چند متغیره ( مانوا) و تحلیل کوواریانس چند متغیره ( مانکووا). پس از یک بحث مختصر در مورد محاسن آنالیز کنتراست و آزمون های تعقیبی، بیایید به مفروضاتی که روش های ANOVA بر اساس آن ها استوار است نگاه کنیم. در پایان این بخش، مزایای یک رویکرد چند متغیره برای تحلیل اندازه‌گیری‌های مکرر نسبت به رویکرد تک متغیره سنتی توضیح داده می‌شود.

ایده های کلیدی

هدف از تحلیل واریانس.هدف اصلی تحلیل واریانس بررسی اهمیت تفاوت بین میانگین ها است. فصل (فصل 8) مقدمه ای کوتاه برای مطالعه اهمیت آماری ارائه می کند. اگر به سادگی میانگین دو نمونه را با هم مقایسه کنید، آنالیز واریانس همان نتیجه تجزیه و تحلیل معمولی را خواهد داشت. تی- آزمایش برای نمونه های مستقل (اگر دو گروه مستقل از اشیاء یا مشاهدات مقایسه شوند) یا تی- معیار برای نمونه های وابسته (اگر دو متغیر بر روی یک مجموعه از اشیاء یا مشاهدات مقایسه شوند). اگر با این معیارها آشنایی ندارید، توصیه می کنیم به مرور فصل مقدماتی مراجعه کنید (فصل 9).

نام از کجا آمده است تحلیل واریانس? ممکن است عجیب به نظر برسد که روش مقایسه میانگین ها آنالیز واریانس نامیده می شود. در واقعیت، این به این دلیل است که وقتی اهمیت آماری تفاوت‌های میانگین را بررسی می‌کنیم، در واقع در حال تجزیه و تحلیل واریانس‌ها هستیم.

تقسیم مجموع مربع ها

برای حجم نمونه n، واریانس نمونه به صورت مجذور انحرافات از میانگین نمونه تقسیم بر n-1 (اندازه نمونه منهای یک) محاسبه می شود. بنابراین، برای اندازه نمونه ثابت n، واریانس تابعی از مجموع مربع ها (انحرافات) است که برای اختصار نشان داده می شود. اس اس(از انگلیسی Sum of Squares - Sum of Squares). اساس تحلیل واریانس، جداسازی (یا تقسیم) واریانس به قطعات است. مجموعه داده های زیر را در نظر بگیرید:

میانگین های دو گروه تفاوت معنی داری دارند (به ترتیب 2 و 6). مجموع انحرافات مجذور داخلهر گروه برابر با 2 است. با جمع کردن آنها به 4 می رسیم. اگر اکنون این محاسبات را تکرار کنیم مستثنی کردنعضویت گروه، یعنی اگر محاسبه کنیم اس اسبر اساس میانگین کلی دو نمونه، 28 به دست می آید. به عبارت دیگر، واریانس (مجموع مربعات) بر اساس تنوع درون گروهی مقادیر بسیار کمتری نسبت به زمانی که بر اساس متغیر کلی محاسبه می شود (نسبت به میانگین کلی). دلیل این امر بدیهی است که تفاوت معنی داری بین میانگین ها وجود دارد و این تفاوت بین میانگین ها تفاوت موجود بین مجموع مربع ها را توضیح می دهد. در واقع، اگر از ماژول برای تجزیه و تحلیل داده های داده شده استفاده کنید تحلیل واریانس، نتایج زیر بدست خواهد آمد:

همانطور که از جدول مشخص است، مجموع مجموع مربع ها اس اس= 28 بر مجموع مربع های داده شده تقسیم می شود درون گروهیتنوع ( 2+2=4 ; ردیف دوم جدول را ببینید) و مجموع مربع ها به دلیل تفاوت در مقادیر میانگین. (28-(2+2)=24؛ ردیف اول جدول را ببینید).

اس اس خطاها واس اس اثرتنوع درون گروهی ( اس اس) معمولاً پراکندگی نامیده می شود خطاهااین بدان معنی است که معمولاً نمی توان آن را پیش بینی یا توضیح داد که آزمایشی انجام می شود. از طرف دیگر، اس اس اثر(یا تنوع بین گروهی) را می توان با تفاوت بین میانگین گروه های مورد مطالعه توضیح داد. به عبارت دیگر تعلق به یک گروه خاص توضیح می دهدتنوع بین گروهی، زیرا می دانیم که این گروه ها ابزارهای مختلفی دارند.

بررسی اهمیتایده های اساسی آزمون معناداری آماری در فصل مورد بحث قرار گرفته است مفاهیم اساسی آمار(فصل 8). این فصل همچنین دلایلی را توضیح می دهد که چرا بسیاری از آزمون ها از نسبت واریانس توضیح داده شده به واریانس غیرقابل توضیح استفاده می کنند. نمونه ای از این استفاده، خود آنالیز واریانس است. آزمایش اهمیت در ANOVA مبتنی بر مقایسه واریانس ناشی از واریانس بین گروهی است (به نام میانگین اثر مربعیا ام‌اساثر) و واریانس ناشی از تنوع درون گروهی (نامیده می شود خطای میانگین مربعاتیا ام‌اسخطا). اگر فرضیه صفر (برابری میانگین ها در دو جامعه) درست باشد، آنگاه می توان انتظار داشت تفاوت نسبتا کمی در میانگین های نمونه به دلیل تغییرات تصادفی وجود داشته باشد. بنابراین، تحت فرض صفر، واریانس درون گروهی عملاً با کل واریانس محاسبه شده بدون در نظر گرفتن عضویت گروه منطبق خواهد شد. واریانس های درون گروهی حاصل را می توان با استفاده از آن مقایسه کرد اف- تستی که بررسی می کند آیا نسبت واریانس به طور قابل توجهی بیشتر از 1 است یا خیر. در مثالی که در بالا بحث شد اف- این معیار نشان می دهد که تفاوت بین میانگین ها از نظر آماری معنی دار است.

منطق پایه تحلیل واریانس.به طور خلاصه، هدف از ANOVA آزمایش اهمیت آماری تفاوت بین میانگین ها (برای گروه ها یا متغیرها) است. این بررسی با استفاده از تحلیل واریانس انجام می شود، یعنی. با تقسیم واریانس کل (تغییر) به بخش هایی که یکی از آنها به دلیل خطای تصادفی (یعنی تنوع درون گروهی) است و دومی با تفاوت در مقادیر میانگین همراه است. سپس آخرین مؤلفه واریانس برای تحلیل اهمیت آماری تفاوت بین میانگین ها استفاده می شود. اگر این تفاوت معنی دار باشد، فرض صفر رد می شود و فرض جایگزین که بین میانگین ها تفاوت وجود دارد پذیرفته می شود.

متغیرهای وابسته و مستقلمتغیرهایی که مقادیر آنها با اندازه گیری در طول آزمایش تعیین می شود (به عنوان مثال، نمره آزمون) نامیده می شوند وابستهمتغیرها متغیرهایی که در یک آزمایش قابل کنترل هستند (مثلاً روش های تدریس یا معیارهای دیگر برای تقسیم مشاهدات به گروه ها) نامیده می شوند. عواملیا مستقلمتغیرها این مفاهیم با جزئیات بیشتری در فصل توضیح داده شده است مفاهیم اساسی آمار(فصل 8).

تحلیل واریانس چند متغیره

در مثال ساده بالا، می توانید بلافاصله آزمون t-test نمونه های مستقل را با استفاده از گزینه ماژول مناسب محاسبه کنید آمار و جداول پایهنتایج به دست آمده به طور طبیعی با نتایج تحلیل واریانس منطبق خواهد بود. با این حال، ANOVA شامل تکنیک های انعطاف پذیر و قدرتمندی است که می تواند برای مطالعات بسیار پیچیده تر استفاده شود.

عوامل بسیاری.جهان ماهیت پیچیده و چند بعدی دارد. موقعیت هایی که یک پدیده خاص به طور کامل توسط یک متغیر توصیف می شود بسیار نادر است. به عنوان مثال، اگر در تلاش برای یادگیری نحوه پرورش گوجه فرنگی بزرگ هستیم، باید عوامل مربوط به ساختار ژنتیکی گیاه، نوع خاک، نور، دما و غیره را در نظر بگیریم. بنابراین، هنگام انجام یک آزمایش معمولی، باید با تعداد زیادی از عوامل دست و پنجه نرم کرد. دلیل اصلی استفاده از ANOVA به مقایسه مکرر دو نمونه در سطوح فاکتورهای مختلف با استفاده از ارجحیت دارد تی- معیار این است که تحلیل واریانس بیشتر باشد تاثير گذارو برای نمونه های کوچک، آموزنده تر.

مدیریت عاملیفرض کنید که در مثال تجزیه و تحلیل دو نمونه ای که در بالا بحث شد، یک عامل دیگر را اضافه کنیم، به عنوان مثال. کف- جنسیت. بگذارید هر گروه از 3 مرد و 3 زن تشکیل شود. طرح این آزمایش را می توان در قالب جدول 2 در 2 ارائه کرد:

آزمایش کنید. گروه 1 آزمایش کنید. گروه 2
مردان2 6
3 7
1 5
میانگین2 6
زنان4 8
5 9
3 7
میانگین4 8

قبل از انجام محاسبات، می توانید متوجه شوید که در این مثال واریانس کل حداقل سه منبع دارد:

(1) خطای تصادفی (در واریانس گروه)،

(2) تنوع مرتبط با عضویت در گروه آزمایشی و

(3) تنوع به دلیل جنسیت اشیاء مشاهده.

(توجه داشته باشید که منبع احتمالی دیگری برای تغییر وجود دارد - تعامل عواملکه در ادامه به آن خواهیم پرداخت). اگر درج نکنیم چه اتفاقی می افتد کفجنسیتبه عنوان عاملی در تجزیه و تحلیل و محاسبه معمول تی-معیار؟ اگر مجموع مربع ها را محاسبه کنیم، نادیده گرفته می شود کف -جنسیت(یعنی ترکیب اشیاء با جنس های مختلف در یک گروه در هنگام محاسبه واریانس درون گروهی، در نتیجه مجموع مربعات برای هر گروه برابر با اس اس= 10، و مجموع مجموع مربع ها اس اس= 10+10 = 20)، سپس مقدار بیشتری از واریانس درون گروهی را نسبت به تجزیه و تحلیل دقیق تر با تقسیم اضافی به زیر گروه ها به دست می آوریم. نیمه جنسیت(در این حالت میانگین درون گروهی برابر با 2 خواهد بود و مجموع مجموع مربعات درون گروهی برابر با اس اس = 2+2+2+2 = 8). این تفاوت به این دلیل است که مقدار متوسط ​​برای مردان - نرهاکمتر از میانگین برای زنان -زن، و این تفاوت در میانگین ها وقتی جنسیت در نظر گرفته نمی شود، تنوع کلی درون گروهی را افزایش می دهد. کنترل واریانس خطا باعث افزایش حساسیت (قدرت) آزمون می شود.

این مثال مزیت دیگری از تحلیل واریانس را در مقایسه با روش معمول نشان می دهد تی- معیار برای دو نمونه. تجزیه و تحلیل واریانس به شما امکان می دهد تا با کنترل مقادیر عوامل باقیمانده، هر عامل را مطالعه کنید. این در واقع دلیل اصلی قدرت آماری بیشتر آن است (برای به دست آوردن نتایج معنی دار به حجم نمونه کوچکتر نیاز است). به همین دلیل، آنالیز واریانس، حتی در نمونه های کوچک، نتایج آماری معنی داری بیشتری نسبت به نمونه های ساده به دست می دهد تی- معیار

اثرات متقابل

استفاده از آنالیز واریانس در مقایسه با روش مرسوم مزیت دیگری نیز دارد تی- معیار: تجزیه و تحلیل واریانس به ما امکان می دهد تشخیص دهیم اثر متقابلبین عوامل و بنابراین امکان مطالعه مدل های پیچیده تر را فراهم می کند. برای توضیح، مثال دیگری را در نظر بگیرید.

اثرات اصلی، تعاملات زوجی (دو عاملی).فرض کنید دانش آموزان دو گروه هستند و از نظر روانی دانش آموزان گروه اول مصمم به انجام وظایف محوله هستند و هدفمندتر از دانش آموزان گروه دوم متشکل از دانش آموزان تنبل تر هستند. بیایید هر گروه را به طور تصادفی به دو نیم کنیم و به نیمی از هر گروه یک کار دشوار و به نیمی دیگر یک کار آسان بدهیم. سپس میزان سختی کار دانش‌آموزان روی این وظایف را اندازه‌گیری می‌کنیم. میانگین های این مطالعه (تخیلی) در جدول نشان داده شده است:

از این نتایج چه نتیجه ای می توان گرفت؟ آیا می توان نتیجه گرفت که: (1) دانش آموزان با شدت بیشتری روی یک کار پیچیده کار می کنند. (2) آیا دانش آموزان با انگیزه بیشتر از دانش آموزان تنبل کار می کنند؟ هیچ یک از این عبارات ماهیت سیستماتیک ابزار نشان داده شده در جدول را در بر نمی گیرد. با تجزیه و تحلیل نتایج، درست تر است که بگوییم فقط دانش آموزان با انگیزه در کارهای دشوار سخت تر کار می کنند، در حالی که فقط دانش آموزان تنبل روی کارهای آسان سخت تر کار می کنند. به عبارت دیگر شخصیت دانش آموزان و سختی کار در حال تعاملبر روی تلاش انجام شده بر یکدیگر تأثیر بگذارند. این یک مثال است تعامل جفتبین شخصیت دانش آموزان و سختی کار. توجه داشته باشید که عبارات 1 و 2 توضیح می دهند اثرات اصلی.

تعاملات مرتبه بالاتردر حالی که توضیح تعاملات زوجی هنوز نسبتاً آسان است، توضیح تعاملات مرتبه بالاتر بسیار دشوارتر است. بیایید تصور کنیم که در مثالی که در بالا در نظر گرفته شد، عامل دیگری معرفی شده است کف -جنسیتو جدول میانگین های زیر را بدست آوردیم:

اکنون از نتایج به دست آمده چه نتایجی می توان گرفت؟ نمودارهای متوسط ​​تفسیر جلوه های پیچیده را آسان می کند. ماژول ANOVA به شما این امکان را می دهد که تقریباً با یک کلیک ماوس این نمودارها را بسازید.

تصویر در نمودارهای زیر نشان دهنده تعامل سه عاملی در حال مطالعه است.

با نگاهی به نمودارها، می‌توان گفت که برای زنان بین شخصیت و دشواری آزمون تعامل وجود دارد: زنان با انگیزه در یک کار دشوار بیشتر از یک کار آسان کار می‌کنند. برای مردان، همین تعامل معکوس است. مشاهده می شود که توصیف تعامل بین عوامل گیج کننده تر می شود.

یک روش کلی برای توصیف تعاملات.به طور کلی، تعامل بین عوامل به عنوان تغییر در یک اثر تحت تأثیر اثر دیگر توصیف می شود. در مثالی که در بالا بحث شد، تعامل دو عاملی را می توان به عنوان تغییر در اثر اصلی عامل مشخص کننده دشواری کار تحت تأثیر عامل توصیف کننده شخصیت دانش آموز توصیف کرد. برای تأثیر متقابل سه عامل پاراگراف قبل، می توان گفت که تأثیر متقابل دو عامل (پیچیدگی تکلیف و شخصیت دانش آموز) تحت تأثیر تغییر می کند. جنسیتجنسیت. اگر تأثیر متقابل چهار عامل بررسی شود، می توان گفت که تأثیر متقابل سه عامل تحت تأثیر عامل چهارم تغییر می کند. انواع مختلفی از تعاملات در سطوح مختلف عامل چهارم وجود دارد. به نظر می رسد که در بسیاری از زمینه ها تعامل پنج یا حتی بیشتر از عوامل غیرعادی نیست.

طرح های پیچیده

طرح‌های بین گروهی و درون گروهی (طرح‌های اندازه‌گیری مکرر)

هنگام مقایسه دو گروه مختلف، معمولاً از آن استفاده می شود تی- معیار برای نمونه های مستقل (از ماژول آمار و جداول پایه). هنگامی که دو متغیر بر روی یک مجموعه از اشیاء (مشاهدات) مقایسه می شوند، از آن استفاده می شود تی-معیار نمونه های وابسته برای آنالیز واریانس نیز مهم است که آیا نمونه ها وابسته هستند یا نه. اگر اندازه گیری های مکرر از متغیرهای یکسان (در شرایط مختلف یا در زمان های مختلف) وجود داشته باشد. برای همان اشیاء، سپس در مورد حضور صحبت می کنند عامل اقدامات مکرر(همچنین به نام عامل درون گروهی،از آنجایی که مجموع مربع های درون گروهی برای ارزیابی اهمیت آن محاسبه می شود). اگر گروه های مختلف اشیاء با هم مقایسه شوند (به عنوان مثال، مردان و زنان، سه سویه باکتری و غیره)، تفاوت بین گروه ها شرح داده می شود. عامل بین گروهیروش های محاسبه معیارهای اهمیت برای دو نوع عامل توصیف شده متفاوت است، اما منطق کلی و تفسیر آنها یکسان است.

طرح های بین گروهی و درون گروهیدر بسیاری از موارد، آزمایش مستلزم گنجاندن هر دو عامل بین آزمودنی ها و عامل اندازه گیری های مکرر در طرح است. به عنوان مثال، مهارت های ریاضی دانش آموزان دختر و پسر اندازه گیری می شود کف -جنسیت-فاکتور بین گروهی) در ابتدا و انتهای ترم. دو معیار مهارت های هر دانش آموز یک عامل درون گروهی (عامل اندازه گیری های مکرر) را تشکیل می دهند. تفسیر تأثیرات و تعاملات اصلی برای عوامل بین آزمودنی ها و عوامل اندازه گیری مکرر سازگار است، و هر دو نوع عامل به وضوح می توانند با یکدیگر تعامل داشته باشند (به عنوان مثال، زنان در طول یک ترم مهارت کسب می کنند، در حالی که مردان آنها را از دست می دهند).

طرح های ناقص (تودرتو).

در بسیاری از موارد می توان از اثر متقابل چشم پوشی کرد. این یا زمانی رخ می دهد که مشخص شود هیچ اثر متقابلی در جمعیت وجود ندارد، یا زمانی که اجرای یک کامل است فاکتوریلطرح غیر ممکن است به عنوان مثال، تأثیر چهار افزودنی سوخت بر مصرف سوخت در حال بررسی است. چهار خودرو و چهار راننده انتخاب می شوند. پر شده فاکتوریلآزمایش مستلزم آن است که هر ترکیب: افزودنی، راننده، ماشین - حداقل یک بار ظاهر شود. این کار به حداقل 4 x 4 x 4 = 64 گروه آزمایش نیاز دارد که بسیار وقت گیر است. علاوه بر این، بعید است که هیچ گونه تعاملی بین راننده و افزودنی سوخت وجود داشته باشد. با در نظر گرفتن این موضوع می توانید از طرح استفاده کنید مربع های لاتین،که فقط شامل 16 گروه آزمایشی است (چهار ماده افزودنی با حروف A، B، C و D مشخص می شوند):

مربع‌های لاتین در بیشتر کتاب‌های طراحی تجربی توصیف شده‌اند (به عنوان مثال، هایس، 1988؛ لیندمن، 1974؛ میلیکن و جانسون، 1984؛ وینر، 1962) و در اینجا به تفصیل مورد بحث قرار نخواهند گرفت. توجه داشته باشید که مربع های لاتین هستند نهnپر شدهطرح هایی که در آن همه ترکیب سطوح فاکتور گنجانده نشده است. برای مثال، راننده 1 ماشین 1 را فقط با افزودنی A رانندگی می کند، راننده 3 ماشین 1 را فقط با افزودنی C رانندگی می کند. سطوح فاکتور مواد افزودنی ( A، B، C و D) در سلول های جدول تودرتو هستند خودروایکس راننده -مثل تخم مرغ در لانه این یادداشت برای درک طبیعت مفید است تو در تو یا تو در توبرنامه ها مدول تحلیل واریانسراه های ساده ای برای تجزیه و تحلیل این نوع طرح ها ارائه می دهد.

تحلیل کوواریانس

ایده اصلی

در فصل ایده های کلیدیایده کنترل عاملی و اینکه چگونه گنجاندن عوامل افزایشی مجموع مجذور خطاها را کاهش می دهد و قدرت آماری طرح را افزایش می دهد به اختصار مورد بحث قرار گرفت. همه اینها را می توان به متغیرهایی با مجموعه ای پیوسته از مقادیر گسترش داد. هنگامی که چنین متغیرهای پیوسته ای به عنوان عوامل در یک طرح گنجانده شوند، نامیده می شوند متغیرهای کمکی.

متغیرهای کمکی ثابت

فرض کنید در حال مقایسه مهارت های ریاضی دو گروه از دانش آموزان هستیم که با استفاده از دو کتاب درسی متفاوت آموزش داده شده اند. بیایید همچنین فرض کنیم که داده های ضریب هوش (IQ) برای هر دانش آموز در دسترس است. می توانید فرض کنید که IQ مربوط به مهارت های ریاضی است و از آن اطلاعات استفاده کنید. برای هر یک از دو گروه از دانش آموزان، ضریب همبستگی بین IQ و مهارت های ریاضی قابل محاسبه است. با استفاده از این ضریب همبستگی، می توان نسبت واریانس را در گروه ها جدا کرد که با تأثیر IQ و نسبت غیرقابل توضیح واریانس توضیح داده می شود (همچنین رجوع کنید به مفاهیم اساسی آمار(فصل 8) و آمار و جداول پایه(فصل 9)). بخش باقی مانده از واریانس در تجزیه و تحلیل به عنوان واریانس خطا استفاده می شود. اگر بین IQ و مهارت های ریاضی همبستگی وجود داشته باشد، می توان واریانس خطا را به میزان قابل توجهی کاهش داد. اس اس/(n-1) .

تاثیر متغیرهای کمکی برF- معیار F-این معیار اهمیت آماری تفاوت در مقادیر میانگین را در گروه ها ارزیابی می کند و نسبت واریانس بین گروهی محاسبه می شود. ام‌اساثر) به واریانس خطا ( ام‌اسخطا) . اگر ام‌اسخطابه عنوان مثال، با در نظر گرفتن فاکتور IQ، مقدار کاهش می یابد افافزایش.

تعداد زیادی متغیر.استدلال استفاده شده در بالا برای یک متغیر کمکی منفرد (IQ) را می توان به راحتی به متغیرهای کمکی متعدد تعمیم داد. به عنوان مثال، علاوه بر ضریب هوشی، می توانید اندازه گیری انگیزه، تفکر فضایی و غیره را نیز در نظر بگیرید. به جای ضریب همبستگی معمول، از ضریب همبستگی چندگانه استفاده می شود.

زمانی که ارزشاف - معیارها کاهش می یابد.گاهی اوقات وارد کردن متغیرهای کمکی در یک طرح آزمایشی از اهمیت می کاهد اف-شاخص . این معمولاً نشان می‌دهد که متغیرهای کمکی نه تنها با متغیر وابسته (مثلاً مهارت‌های ریاضی) بلکه با عوامل (مثلاً کتاب‌های درسی مختلف) همبستگی دارند. فرض کنید ضریب هوشی در پایان ترم، پس از تقریباً یک سال تدریس دو گروه از دانش آموزان با استفاده از دو کتاب درسی متفاوت، اندازه گیری می شود. اگرچه دانش‌آموزان به‌طور تصادفی به گروه‌ها تقسیم شدند، اما ممکن است تفاوت‌های کتاب درسی آنقدر زیاد باشد که هم مهارت‌های هوش و هم مهارت‌های ریاضی بین گروه‌ها بسیار متفاوت باشد. در این حالت، متغیرهای کمکی نه تنها واریانس خطا، بلکه واریانس بین گروهی را نیز کاهش می دهند. به عبارت دیگر، پس از کنترل تفاوت در IQ در بین گروه ها، تفاوت در مهارت های ریاضی دیگر قابل توجه نیست. شما می توانید آن را متفاوت بگویید. پس از «رد کردن» تأثیر ضریب هوشی، تأثیر کتاب درسی بر رشد مهارت‌های ریاضی ناخواسته حذف می‌شود.

میانگین های تعدیل شدهوقتی یک متغیر کمکی بر فاکتور بین موضوعات تأثیر می گذارد، باید محاسبه کرد وسیله تنظیم شده، یعنی معنی هایی که پس از حذف تمام تخمین های متغیر کمکی به دست می آیند.

تعامل بین متغیرهای کمکی و عوامل.همانطور که تعامل بین عوامل مورد بررسی قرار می گیرد، تعامل بین متغیرهای کمکی و بین گروهی از عوامل قابل بررسی است. فرض کنید یکی از کتاب های درسی مخصوصاً برای دانش آموزان باهوش مناسب است. کتاب دوم برای دانش آموزان باهوش خسته کننده است و همین کتاب برای دانش آموزان کم باهوش دشوار است. در نتیجه، بین IQ و نتیجه یادگیری در گروه اول (دانش آموزان باهوش تر، نتایج بهتر) همبستگی مثبت و در گروه دوم همبستگی منفی صفر یا خفیف وجود دارد (هر چه دانش آموز باهوش تر باشد، احتمال کسب مهارت های ریاضی کمتر می شود. از کتاب درسی دوم). برخی از مطالعات این وضعیت را به عنوان نمونه ای از نقض مفروضات تحلیل کوواریانس مورد بحث قرار می دهند. با این حال، از آنجایی که ماژول ANOVA از متداول‌ترین روش‌های تحلیل کوواریانس استفاده می‌کند، به‌ویژه امکان ارزیابی اهمیت آماری تعامل بین عوامل و متغیرهای کمکی وجود دارد.

متغیرهای کمکی متغیر

در حالی که متغیرهای کمکی ثابت اغلب در کتاب‌های درسی مورد بحث قرار می‌گیرند، متغیرهای کمکی متغیر بسیار کمتر ذکر شده‌اند. به طور معمول، هنگام انجام آزمایش‌هایی با اندازه‌گیری‌های مکرر، ما به تفاوت در اندازه‌گیری‌های مقادیر یکسان در مقاطع مختلف زمانی علاقه‌مندیم. یعنی ما به اهمیت این تفاوت ها علاقه مندیم. اگر متغیرهای کمکی همزمان با اندازه گیری متغیرهای وابسته اندازه گیری شوند، می توان همبستگی بین متغیر کمکی و متغیر وابسته را محاسبه کرد.

به عنوان مثال، علاقه ریاضی و مهارت های ریاضی را می توان در ابتدا و انتهای ترم بررسی کرد. بررسی اینکه آیا تغییرات در علاقه به ریاضیات با تغییرات در مهارت های ریاضی مرتبط است یا خیر، جالب خواهد بود.

مدول تحلیل واریانس V آماربه طور خودکار اهمیت آماری تغییرات در متغیرهای کمکی در طرح ها را در صورت امکان ارزیابی می کند.

طرح های چند متغیره: تحلیل واریانس چند متغیره و کوواریانس

طرح های بین گروهی

تمام مثال‌هایی که قبلاً مورد بحث قرار گرفت، فقط یک متغیر وابسته را شامل می‌شد. وقتی چندین متغیر وابسته به طور همزمان وجود داشته باشد، فقط پیچیدگی محاسبات افزایش می یابد، اما محتوا و اصول اولیه تغییر نمی کند.

به عنوان مثال، مطالعه ای روی دو کتاب درسی مختلف انجام شده است. در عین حال موفقیت دانش آموزان در تحصیل دروس فیزیک و ریاضی مطالعه می شود. در این مورد، دو متغیر وابسته وجود دارد و باید دریابید که چگونه دو کتاب درسی مختلف به طور همزمان روی آنها تأثیر می گذارند. برای این کار می توانید از تحلیل واریانس چند متغیره (MANOVA) استفاده کنید. به جای تک بعدی افمعیار، چند بعدی استفاده می شود افآزمون (آزمون ویلکس l)، بر اساس مقایسه ماتریس کوواریانس خطا و ماتریس کوواریانس بین گروهی.

اگر متغیرهای وابسته با یکدیگر همبستگی دارند، در محاسبه معیار معناداری باید این همبستگی در نظر گرفته شود. بدیهی است که اگر همان اندازه گیری دو بار تکرار شود، چیز جدیدی نمی توان به دست آورد. اگر یک بعد همبسته به بعد موجود اضافه شود، مقداری اطلاعات جدید به دست می آید، اما متغیر جدید حاوی اطلاعات اضافی است که در کوواریانس بین متغیرها منعکس می شود.

تفسیر نتایج.اگر آزمون کلی چند متغیره معنادار باشد، می‌توان نتیجه گرفت که اثر مربوطه (به عنوان مثال، نوع کتاب درسی) معنی‌دار است. با این حال، سوالات زیر مطرح می شود. آیا نوع کتاب درسی فقط در مهارت‌های ریاضی، فقط مهارت‌های فیزیکی یا هر دو مهارت تأثیر دارد؟ در واقع، پس از به دست آوردن یک آزمون چند متغیره قابل توجه، یک آزمون تک متغیره برای اثر اصلی یا تعامل فردی مورد بررسی قرار می گیرد. افمعیار به عبارت دیگر، متغیرهای وابسته ای که به معنی دار بودن آزمون چند متغیره کمک می کنند، به طور جداگانه بررسی می شوند.

طرح‌های اقدامات مکرر

اگر مهارت های ریاضی و فیزیک دانش آموزان در ابتدای ترم و در پایان ترم سنجیده شود، آنگاه این اقدامات تکراری هستند. بررسی معیار اهمیت در این گونه طرح ها، توسعه منطقی مورد تک بعدی است. توجه داشته باشید که تکنیک های تحلیل واریانس چند متغیره نیز معمولاً برای بررسی اهمیت عوامل اندازه گیری مکرر تک متغیره با بیش از دو سطح استفاده می شود. کاربردهای مربوطه بعداً در این بخش مورد بحث قرار خواهد گرفت.

مجموع مقادیر متغیر و تحلیل واریانس چند متغیره

حتي كاربران باتجربه تحليل واريانس تك متغيره و چند متغيره اغلب هنگام اعمال تحليل واريانس چند متغيره براي سه متغير و هنگام اعمال تحليل واريانس تك متغيره بر مجموع اين سه متغير، به سختي به نتايج متفاوتي دست مي يابند. یک متغیر واحد بودند.

اندیشه جمع بندیمتغیرها این است که هر متغیر حاوی مقداری متغیر واقعی است که در حال مطالعه است و همچنین یک خطای اندازه گیری تصادفی. بنابراین، هنگام میانگین‌گیری مقادیر متغیرها، خطای اندازه‌گیری برای همه اندازه‌گیری‌ها نزدیک‌تر به صفر خواهد بود و مقادیر میانگین قابل اعتمادتر خواهند بود. در واقع، در این مورد، اعمال ANOVA برای مجموع متغیرها، یک تکنیک منطقی و قدرتمند است. اما اگر ماهیت متغیرهای وابسته چند بعدی باشد، جمع کردن مقادیر متغیرها نامناسب است.

برای مثال، اجازه دهید متغیرهای وابسته از چهار شاخص تشکیل شده باشند موفقیت در جامعه. هر شاخص یک جنبه کاملاً مستقل از فعالیت انسانی را مشخص می کند (به عنوان مثال، موفقیت حرفه ای، موفقیت در تجارت، رفاه خانواده و غیره). افزودن این متغیرها مانند افزودن سیب و پرتقال است. مجموع این متغیرها معیار تک بعدی مناسبی نخواهد بود. بنابراین، چنین داده هایی باید به عنوان شاخص های چند بعدی در نظر گرفته شوند تحلیل واریانس چند متغیره.

تجزیه و تحلیل کنتراست و آزمون های تعقیبی

چرا مجموعه های جداگانه ای از میانگین ها با هم مقایسه می شوند؟

به طور معمول، فرضیه‌های مربوط به داده‌های تجربی صرفاً از نظر تأثیرات یا تعاملات اصلی فرمول‌بندی نمی‌شوند. یک مثال می تواند این فرضیه باشد: یک کتاب درسی خاص مهارت های ریاضی را فقط در دانش آموزان پسر بهبود می بخشد، در حالی که کتاب درسی دیگر تقریباً برای هر دو جنس به یک اندازه مؤثر است، اما هنوز برای پسران کمتر مؤثر است. می توان پیش بینی کرد که اثربخشی کتاب درسی با جنسیت دانش آموز ارتباط متقابل دارد. با این حال، این پیش بینی نیز صدق می کند طبیعتفعل و انفعالات. برای دانش‌آموزانی که از یک کتاب استفاده می‌کنند، تفاوت معناداری بین جنسیت‌ها و برای دانش‌آموزانی که از کتاب دیگر استفاده می‌کنند، نتایج عملاً مستقل بر اساس جنسیت انتظار می‌رود. این نوع فرضیه معمولا با استفاده از تحلیل کنتراست بررسی می شود.

تجزیه و تحلیل کنتراست ها

به طور خلاصه، تجزیه و تحلیل کنتراست به شخص اجازه می دهد تا اهمیت آماری ترکیبات خطی خاصی از اثرات پیچیده را ارزیابی کند. تجزیه و تحلیل کنتراست عنصر اصلی و اجباری هر طرح ANOVA پیچیده است. مدول تحلیل واریانسدارای قابلیت های بسیار متنوعی از تجزیه و تحلیل کنتراست است که به شما امکان می دهد هر نوع مقایسه ای از ابزارها را جداسازی و تجزیه و تحلیل کنید.

پسینیمقایسه ها

گاهی اوقات، در نتیجه پردازش یک آزمایش، یک اثر غیر منتظره کشف می شود. اگرچه در بیشتر موارد یک محقق خلاق می تواند هر نتیجه ای را توضیح دهد، اما این امکان تحلیل و تخمین بیشتر برای پیش بینی را نمی دهد. این مشکل یکی از مواردی است که برای آن معیارهای پسینی، یعنی معیارهایی که استفاده نمی کنند پیشینفرضیه ها برای نشان دادن، آزمایش زیر را در نظر بگیرید. فرض کنید 100 کارت حاوی اعداد از 1 تا 10 وجود دارد. با قرار دادن همه این کارت ها در یک هدر، 5 کارت را به طور تصادفی 20 بار انتخاب می کنیم و میانگین مقدار (میانگین اعداد نوشته شده روی کارت ها) را برای هر نمونه محاسبه می کنیم. آیا می توانید انتظار داشته باشید که دو نمونه وجود داشته باشد که میانگین آنها به طور قابل توجهی متفاوت است؟ این بسیار قابل قبول است! با انتخاب دو نمونه با میانگین ماکزیمم و حداقل می توانید تفاوت میانگینی را به دست آورید که با تفاوت میانگین ها مثلاً دو نمونه اول بسیار متفاوت است. این تفاوت را می توان برای مثال با استفاده از تحلیل کنتراست بررسی کرد. بدون پرداختن به جزئیات، چندین به اصطلاح وجود دارد پسینیمعیارهایی که دقیقاً بر اساس سناریوی اول (گرفتن میانگین های افراطی از 20 نمونه) است، یعنی این معیارها بر اساس انتخاب متفاوت ترین ابزارها برای مقایسه همه ابزارها در طراحی است. این معیارها برای اطمینان از اینکه یک اثر مصنوعی صرفاً تصادفی به دست نمی‌آید استفاده می‌شود، به عنوان مثال، برای تشخیص تفاوت معنی‌دار بین میانگین‌ها در صورت عدم وجود. مدول تحلیل واریانسطیف گسترده ای از این معیارها را ارائه می دهد. هنگامی که نتایج غیرمنتظره ای در یک آزمایش شامل چندین گروه مشاهده می شود، پس پسینیروش‌هایی برای بررسی اهمیت آماری نتایج به‌دست‌آمده.

مجموع مربع های نوع I، II، III و IV

رگرسیون چند متغیره و تحلیل واریانس

بین روش رگرسیون چند متغیره و تحلیل واریانس (تحلیل واریانس) رابطه نزدیک وجود دارد. در هر دو روش، یک مدل خطی مورد مطالعه قرار گرفته است. به طور خلاصه، تقریباً تمام طرح های آزمایشی را می توان با استفاده از رگرسیون چند متغیره بررسی کرد. طرح ساده بین گروهی 2×2 زیر را در نظر بگیرید.

D.V. آ ب AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

ستون های A و B حاوی کدهایی هستند که سطوح عوامل A و B را مشخص می کنند، ستون AxB حاوی حاصل ضرب دو ستون A و B است. ما می توانیم این داده ها را با استفاده از رگرسیون چند متغیره تجزیه و تحلیل کنیم. متغیر D.V.به عنوان یک متغیر وابسته تعریف می شود، متغیرها از آقبل از AxBبه عنوان متغیرهای مستقل بررسی معنی داری برای ضرایب رگرسیون با محاسبات در تحلیل واریانس اهمیت اثرات اصلی عوامل همزمان خواهد بود. آو بو اثر متقابل AxB.

برنامه های نامتعادل و متعادل

هنگام محاسبه ماتریس همبستگی برای همه متغیرها، مانند داده های نشان داده شده در بالا، متوجه خواهید شد که اثرات اصلی عوامل آو بو اثر متقابل AxBنامرتبط به این خاصیت افکت ها متعامد بودن نیز می گویند. می گویند اثرات آو ب - قائمیا مستقلاز یکدیگر. اگر تمام جلوه‌های یک طرح متعامد با یکدیگر باشند، مانند مثال بالا، آنگاه به پلان گفته می‌شود که متعادل.

طرح های متوازن دارای یک "ملاک خوب" هستند. محاسبات برای تجزیه و تحلیل چنین طرح هایی بسیار ساده است. تمام محاسبات به محاسبه همبستگی بین اثرات و متغیرهای وابسته خلاصه می شود. از آنجایی که اثرات متعامد هستند، همبستگی های جزئی (مانند کامل چند بعدیرگرسیون ها) محاسبه نمی شوند. با این حال، در زندگی واقعی برنامه ها همیشه متعادل نیستند.

بیایید داده های واقعی را با تعداد نابرابر مشاهدات در سلول ها در نظر بگیریم.

عامل A عامل B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

اگر این داده ها را مانند بالا کدگذاری کنیم و یک ماتریس همبستگی برای همه متغیرها محاسبه کنیم، متوجه می شویم که عوامل طراحی با یکدیگر همبستگی دارند. فاکتورهای یک پلان دیگر متعامد نیستند و به چنین پلان هایی گفته می شود نامتعادلتوجه داشته باشید که در مثال مورد بررسی، همبستگی بین عوامل کاملاً به دلیل تفاوت فرکانس های 1 و -1 در ستون های ماتریس داده است. به عبارت دیگر، طرح‌های آزمایشی با حجم‌های سلولی نابرابر (به طور دقیق‌تر، حجم‌های نامتناسب) نامتعادل خواهند بود، به این معنی که تأثیرات و تعاملات اصلی مخدوش خواهند شد. در این حالت باید رگرسیون چند متغیره کامل برای محاسبه معناداری آماری اثرات محاسبه شود. در اینجا چندین استراتژی وجود دارد.

مجموع مربع های نوع I، II، III و IV

مجموع مربع ها نوعمنوIII. برای بررسی اهمیت هر عامل در یک مدل چند متغیره، می توان همبستگی جزئی هر عامل را محاسبه کرد، مشروط بر اینکه همه عوامل دیگر قبلاً در مدل لحاظ شده باشند. همچنین می توانید فاکتورها را به صورت گام به گام وارد مدل کنید و تمام فاکتورهایی که قبلاً وارد مدل شده اند را در نظر بگیرید و همه عوامل دیگر را نادیده بگیرید. به طور کلی، این تفاوت است نوع IIIو نوعمنمجموع مربعات (این اصطلاح در SAS معرفی شد، به عنوان مثال، به SAS، 1982 مراجعه کنید؛ بحث مفصل را نیز می توان در Searle، 1987، p. 461؛ Woodward, Bonett, and Brecht, 1990, p. 216؛ یا Milliken یافت. و جانسون، 1984، ص 138).

مجموع مربع ها نوعII.استراتژی شکل‌گیری مدل «متوسط» بعدی شامل موارد زیر است: کنترل همه اثرات اصلی هنگام بررسی اهمیت یک اثر اصلی. در کنترل همه اثرات اصلی و همه تعاملات زوجی هنگام بررسی اهمیت یک تعامل زوجی فردی. در کنترل تمام اثرات اصلی همه تعاملات زوجی و همه تعاملات سه عامل. هنگام مطالعه تعامل فردی سه عامل و غیره. مجموع مربعات برای اثرات محاسبه شده در این روش نامیده می شود نوعIIمجموع مربعات. بنابراین، نوعIIمجموع مربع‌های کنترل برای همه افکت‌های یک مرتبه و پایین‌تر، در حالی که همه جلوه‌های مرتبه بالاتر را نادیده می‌گیرند.

مجموع مربع ها نوعIV. در نهایت، برای برخی از طرح های خاص با سلول های مفقود (طرح های ناقص) می توان به اصطلاح محاسبه کرد. نوع IVمجموع مربعات. این روش بعداً در رابطه با طرح های ناقص (طرح هایی با سلول های از دست رفته) مورد بحث قرار خواهد گرفت.

تفسیر فرضیه مجموع مربعات انواع I، II و III

مجموع مربعات نوعIIIساده ترین تفسیر به یاد بیاورید که مجموع مربع ها نوعIIIپس از کنترل سایر اثرات، اثرات را بررسی کنید. به عنوان مثال، پس از یافتن یک معنی دار آماری نوعIIIاثر برای عامل آدر ماژول تحلیل واریانس، می توان گفت که یک اثر معنی دار واحد وجود دارد آ، پس از معرفی تمامی اثرات (عوامل) دیگر و تفسیر این اثر بر اساس آن. احتمالاً در 99٪ از تمام برنامه های ANOVA، این نوع آزمایشی است که محقق به آن علاقه دارد. این نوع مجموع مربع ها معمولاً به صورت مدول محاسبه می شود تحلیل واریانسبه طور پیش فرض، صرف نظر از اینکه گزینه انتخاب شده باشد یا خیر رویکرد رگرسیونیا خیر (رویکردهای استاندارد اتخاذ شده در ماژول تحلیل واریانسدر زیر بحث شده است).

اثرات قابل توجهی به دست آمده با استفاده از مجموع مربع نوعیا نوعIIتفسیر مجموع مربع ها چندان آسان نیست. آنها به بهترین وجه در زمینه رگرسیون چند متغیره گام به گام تفسیر می شوند. اگر، هنگام استفاده از مجموع مربع ها نوعمناثر اصلی عامل B معنی دار بود (پس از اینکه عامل A در مدل گنجانده شد، اما قبل از اضافه شدن برهمکنش بین A و B)، می توان نتیجه گرفت که اثر اصلی معنی دار عامل B وجود دارد، مشروط بر اینکه برهمکنش وجود نداشته باشد. بین عوامل A و B. (در صورت استفاده از معیار نوعIIIفاکتور B نیز معنی دار بود، پس از وارد کردن سایر عوامل و اثرات متقابل آنها در مدل می توان نتیجه گرفت که اثر اصلی عامل B معنی دار است.

از نظر حاشیه ای به معنای فرضیه نوعمنو نوعIIمعمولاً تفسیر ساده ای ندارند. در این موارد گفته می شود که صرفاً با نگاه به ابزارهای حاشیه ای نمی توان اهمیت تأثیرات را تفسیر کرد. بلکه ارائه شده است پمیانگین ها مربوط به یک فرضیه پیچیده است که میانگین و حجم نمونه را ترکیب می کند. مثلا، نوعIIفرضیه های عامل A در مثال ساده یک طرح 2×2 که قبلاً مورد بحث قرار گرفت این خواهد بود (رجوع کنید به Woodward, Bonett, and Brecht, 1990, p. 219):

nij- تعداد مشاهدات در سلول

uij- مقدار متوسط ​​در سلول

n. j- میانگین حاشیه ای

بدون پرداختن به جزئیات (برای جزئیات بیشتر، رجوع کنید به Milliken and Johnson، 1984، فصل 10)، واضح است که اینها فرضیه های ساده ای نیستند و در بیشتر موارد هیچ یک از آنها برای محقق مورد توجه خاص قرار نمی گیرند. با این حال، مواردی وجود دارد که فرضیه ها نوعمنممکن است جالب باشد

رویکرد محاسباتی پیش فرض در ماژول تحلیل واریانس

در صورتی که گزینه علامت نخورده باشد، پیش‌فرض است رویکرد رگرسیون، مدول تحلیل واریانساستفاده می کند مدل میانگین سلولی. مشخصه این مدل این است که مجموع مربع ها برای اثرات مختلف برای ترکیب خطی میانگین سلول ها محاسبه می شود. در یک آزمایش فاکتوریل کامل، این نتیجه به مجموع مربع‌هایی می‌رسد که با مجموع مربع‌هایی که قبلاً بحث شد، یکسان است. نوع III. با این حال، در گزینه مقایسه های برنامه ریزی شده(در پنجره نتایج ANOVA، کاربر می تواند یک فرضیه را در برابر هر ترکیب خطی از میانگین سلولی وزن دار یا بدون وزن آزمایش کند. بنابراین، کاربر می تواند نه تنها فرضیه ها را آزمایش کند نوعIII، اما فرضیه هایی از هر نوع (از جمله نوعIV). این رویکرد کلی به ویژه هنگام بررسی طرح هایی با سلول های گمشده (به نام طرح های ناقص) مفید است.

برای طرح‌های فاکتوریل کامل، این رویکرد زمانی مفید است که کسی بخواهد میانگین‌های حاشیه وزنی را تحلیل کند. برای مثال، فرض کنید که در طرح ساده 2×2 که قبلاً در نظر گرفته شد، باید وزن‌ها را (بر اساس سطوح عاملی) مقایسه کنیم. ب) معنی حاشیه ای برای فاکتور A. این زمانی مفید است که توزیع مشاهدات در بین سلول ها توسط آزمایشگر تهیه نشده باشد، بلکه به طور تصادفی ساخته شده است، و این تصادفی در توزیع تعداد مشاهدات در سطوح فاکتور B در محیط منعکس می شود. تجمیع.

به عنوان مثال، یک عامل وجود دارد - سن بیوه ها. نمونه احتمالی پاسخ دهندگان به دو گروه زیر 40 سال و بالای 40 سال (عامل ب) تقسیم می شود. دومین عامل (عامل A) در این طرح این بود که آیا زنان بیوه از برخی آژانس ها حمایت اجتماعی دریافت می کردند یا نه (برخی از زنان بیوه به طور تصادفی انتخاب شدند، برخی دیگر به عنوان کنترل عمل کردند). در این مورد، توزیع بیوه ها بر اساس سن در نمونه، منعکس کننده توزیع واقعی بیوه ها بر اساس سن در جمعیت است. ارزیابی اثربخشی گروه حمایت اجتماعی برای زنان بیوه تمام سنینبا میانگین وزنی برای دو گروه سنی (با وزن های مربوط به تعداد مشاهدات در گروه) مطابقت دارد.

مقایسه های برنامه ریزی شده

توجه داشته باشید که مجموع ضرایب کنتراست وارد شده لزوماً برابر 0 (صفر) نیست. در عوض، برنامه به طور خودکار تنظیماتی را انجام می دهد تا اطمینان حاصل شود که فرضیه های مربوطه با میانگین کلی اشتباه گرفته نمی شوند.

برای نشان دادن این موضوع، اجازه دهید به طرح ساده 2×2 که قبلاً بحث شد، برگردیم. به یاد بیاورید که تعداد مشاهدات در سلول‌های این طرح نامتعادل 1-، 2، 3 و 1 است. فرض کنید می‌خواهیم میانگین وزنی حاشیه‌ای را برای فاکتور A (وزن‌دهی شده با فراوانی سطوح عامل B) مقایسه کنیم. می توانید ضرایب کنتراست را وارد کنید:

توجه داشته باشید که این ضرایب تا 0 جمع نمی شوند. برنامه ضرایب را طوری تنظیم می کند که آنها تا 0 جمع شوند و مقادیر نسبی آنها حفظ می شود، یعنی:

1/3 2/3 -3/4 -1/4

این تضادها میانگین های وزنی را برای عامل A مقایسه می کنند.

فرضیه هایی در مورد میانگین اصلیبا استفاده از ضرایب می توان این فرضیه را که میانگین اصلی وزنی نشده 0 است بررسی کرد:

این فرضیه که میانگین وزنی اصلی 0 است با استفاده از:

برنامه در هیچ موردی نسبت کنتراست را تنظیم نمی کند.

تجزیه و تحلیل طرح های دارای سلول های گمشده (طرح های ناقص)

طرح های فاکتوریال حاوی سلول های خالی (ترکیب پردازش سلول هایی که هیچ مشاهده ای ندارند) ناقص نامیده می شوند. در این گونه طرح ها، برخی از فاکتورها معمولاً متعامد نیستند و نمی توان برخی از فعل و انفعالات را محاسبه کرد. به طور کلی روش بهتری برای تجزیه و تحلیل چنین طرح هایی وجود ندارد.

رویکرد رگرسیون

در برخی از برنامه‌های قدیمی‌تر که بر تجزیه و تحلیل طرح‌های ANOVA با استفاده از رگرسیون چند متغیره تکیه می‌کنند، عوامل در طرح‌های ناقص به طور پیش‌فرض طبق معمول مشخص می‌شوند (مثل اینکه طراحی کامل شده است). سپس تجزیه و تحلیل رگرسیون چند متغیره بر روی این عوامل رمزگذاری شده ساختگی انجام می شود. متأسفانه، این روش نتایجی را ایجاد می کند که تفسیر آنها اگر غیرممکن نباشد، بسیار دشوار است، زیرا مشخص نیست که هر اثر چگونه به ترکیب خطی ابزارها کمک می کند. مثال ساده زیر را در نظر بگیرید.

عامل A عامل B
B1 B2
A1 3 4, 5
A2 6, 6, 7 از دست رفته

اگر رگرسیون چند متغیره فرم را انجام دهیم متغیر وابسته = ثابت + عامل A + عامل B، سپس فرضیه اهمیت عوامل A و B از نظر ترکیب خطی میانگین ها به صورت زیر است:

فاکتور A: سلول A1,B1 = سلول A2,B1

فاکتور B: سلول A1,B1 = سلول A1,B2

این مورد ساده است. در طرح های پیچیده تر، تعیین اینکه دقیقاً چه چیزی مورد بررسی قرار می گیرد، غیرممکن است.

سلول به معنی، رویکرد ANOVA , فرضیه های نوع چهارم

رویکردی که در ادبیات توصیه می شود و ترجیحاً به نظر می رسد، مطالعه معنادار (از نظر سؤالات تحقیق) است. پیشینفرضیه هایی در مورد ابزارهای مشاهده شده در سلول های طرح. بحث تفصیلی این رویکرد را می توان در دوج (1985)، هایبرگر (1989)، میلیکن و جانسون (1984)، سرل (1987)، یا وودوارد، بونت و برشت (1990) یافت. مجموع مربع‌های مرتبط با فرضیه‌های مربوط به ترکیب خطی میانگین‌ها در طرح‌های ناقص که تخمین بخشی از اثرات را بررسی می‌کنند، مجموع مربع نیز نامیده می‌شوند. IV.

تولید خودکار فرضیه های نوعIV. هنگامی که طرح های چند متغیره دارای الگوهای پیچیده سلول گمشده هستند، تعریف فرضیه های متعامد (مستقل) که بررسی آنها معادل بررسی اثرات یا تعاملات اصلی است، مطلوب است. استراتژی‌های الگوریتمی (محاسباتی) (بر اساس ماتریس طراحی شبه معکوس) برای تولید وزن‌های مناسب برای چنین مقایسه‌هایی ایجاد شده‌اند. متأسفانه، فرضیه های نهایی به روشی منحصر به فرد تعریف نشده اند. البته، آنها به ترتیب شناسایی تأثیرات بستگی دارند و به ندرت امکان تفسیر ساده را فراهم می کنند. بنابراین توصیه می‌شود ماهیت سلول‌های از دست رفته را به‌دقت مطالعه کرده، سپس فرضیه‌هایی را تدوین کنید نوعIV, که به طور معناداری با اهداف مطالعه مطابقت دارد. سپس این فرضیه ها را با استفاده از گزینه بررسی کنید مقایسه های برنامه ریزی شدهدر پنجره نتایج. ساده ترین راه برای مشخص کردن مقایسه ها در این مورد، نیاز به معرفی یک بردار کنتراست برای همه عوامل است. با یکدیگردر پنجره مقایسه های برنامه ریزی شدهپس از فراخوانی کادر محاوره ای مقایسه های برنامه ریزی شدههمه گروه‌های موجود در طرح فعلی نشان داده می‌شوند و آنهایی که گم شده‌اند علامت‌گذاری می‌شوند.

سلول های از دست رفته و آزمایش برای اثر خاص

انواع مختلفی از طرح‌ها وجود دارد که در آنها مکان سلول‌های از دست رفته تصادفی نیست، اما به دقت برنامه‌ریزی شده است و امکان تجزیه و تحلیل ساده اثرات اصلی را بدون تأثیرگذاری بر سایر اثرات فراهم می‌کند. به عنوان مثال، زمانی که تعداد سلول های مورد نیاز در یک پلان در دسترس نباشد، اغلب از پلان ها استفاده می شود مربع های لاتینبرای برآورد اثرات اصلی چندین عامل با تعداد سطوح زیاد. به عنوان مثال، یک طرح فاکتوریل 4 x 4 x 4 x 4 به 256 سلول نیاز دارد. در عین حال می توانید استفاده کنید مربع یونانی-لاتینبرای تخمین اثرات اصلی تنها با 16 سلول در طراحی (فصل برنامه ریزی آزمایشی، جلد چهارم، شامل شرح مفصلی از این گونه طرح ها می باشد). طرح های ناقصی که در آنها می توان اثرات اصلی (و برخی از تعاملات) را با استفاده از ترکیبات خطی ساده از وسایل تخمین زد، نامیده می شود. برنامه های ناقص متعادل.

در طرح‌های متعادل، روش استاندارد (پیش‌فرض) ایجاد کنتراست‌ها (وزن‌ها) برای جلوه‌های اصلی و برهمکنش‌ها، جدولی از تحلیل واریانس‌ها را تولید می‌کند که در آن مجموع مربع‌ها برای اثرات مربوطه با یکدیگر اشتباه گرفته نمی‌شوند. گزینه جلوه های خاصپنجره نتایجبا نوشتن یک صفر در سلول های طرح از دست رفته، کنتراست های از دست رفته را ایجاد می کند. بلافاصله پس از درخواست گزینه جلوه های خاصبرای کاربری که برخی فرضیه ها را بررسی می کند، جدولی از نتایج با وزن های واقعی ظاهر می شود. توجه داشته باشید که در یک طراحی متعادل، مجموع مجذورات اثرات مربوطه تنها در صورتی محاسبه می‌شود که آن اثرات متعامد (مستقل) نسبت به سایر اثرات و برهمکنش‌های اصلی باشند. در غیر این صورت، باید از گزینه استفاده کنید مقایسه های برنامه ریزی شدهبرای بررسی مقایسه های معنادار بین میانگین ها.

سلول های از دست رفته و اثرات ادغام شده/عبارات خطا

اگر گزینه رویکرد رگرسیوندر پانل شروع ماژول تحلیل واریانسانتخاب نشده است، مدل میانگین سلول هنگام محاسبه مجموع مربع ها برای جلوه ها استفاده می شود (تنظیم پیش فرض). اگر طراحی متعادل نباشد، هنگام ترکیب جلوه های غیر متعامد (به بحث بالا در مورد گزینه مراجعه کنید سلول های از دست رفته و اثر خاص) می توان مجموع مربع های متشکل از اجزای غیر متعامد (یا همپوشانی) را بدست آورد. نتایج به دست آمده معمولا قابل تفسیر نیستند. بنابراین در انتخاب و اجرای طرح های آزمایشی پیچیده ناقص باید بسیار دقت کرد.

کتاب های زیادی با بحث های مفصل درباره انواع مختلف طرح ها وجود دارد. (دوج، 1985؛ هایبرگر، 1989؛ لیندمن، 1974؛ میلیکن و جانسون، 1984؛ سرل، 1987؛ وودوارد و بونت، 1990)، اما این نوع اطلاعات خارج از محدوده این کتاب درسی است. با این حال، تجزیه و تحلیل انواع مختلف طرح ها بعداً در این بخش نشان داده خواهد شد.

مفروضات و آثار نقض مفروضات

انحراف از فرض توزیع نرمال

فرض کنید متغیر وابسته در مقیاس عددی اندازه گیری شده است. همچنین فرض کنید که متغیر وابسته به طور معمول در هر گروه توزیع شده است. تحلیل واریانسشامل طیف گسترده ای از نمودارها و آمار برای حمایت از این فرض است.

اثرات اختلال.اصلا افاین آزمون در برابر انحراف از نرمال بودن بسیار قوی است (برای نتایج دقیق، به لیندمن، 1974 مراجعه کنید). اگر کشیدگی بزرگتر از 0 باشد، مقدار آماره است افممکن است بسیار کوچک شود فرضیه صفر پذیرفته شده است، اگرچه ممکن است درست نباشد. هنگامی که کشیدگی کمتر از 0 باشد وضعیت معکوس می شود. چولگی توزیع معمولاً تأثیر کمی بر روی آن دارد افآمار. اگر تعداد مشاهدات در یک سلول به اندازه کافی زیاد باشد، انحراف از حالت عادی به ویژه قابل توجه نیست. تئوری حد مرکزی، که بر اساس آن توزیع مقدار متوسط ​​بدون توجه به توزیع اولیه نزدیک به نرمال است. بحث مفصل در مورد پایداری افآمار را می توان در باکس و اندرسون (1955) یا لیندمن (1974) یافت.

یکنواختی واریانس

مفروضاتفرض بر این است که واریانس های گروه های مختلف طراحی یکسان است. این فرض را فرض می نامند همگنی واریانسبه یاد بیاورید که در ابتدای این بخش، هنگام تشریح محاسبه مجموع مربعات خطاها، جمع بندی را در هر گروه انجام دادیم. اگر واریانس ها در دو گروه با یکدیگر متفاوت باشند، جمع کردن آنها خیلی طبیعی نیست و تخمینی از کل واریانس درون گروهی ارائه نمی دهد (زیرا در این مورد اصلا واریانس کل وجود ندارد). مدول تحلیل واریانس -ANOVA/MANOVAشامل مجموعه بزرگی از معیارهای آماری برای تشخیص انحرافات از مفروضات همگنی واریانس است.

اثرات اختلال.لیندمن (1974، ص 33) نشان می دهد که افاین معیار با توجه به نقض مفروضات همگنی واریانس کاملاً پایدار است ( ناهمگونیواریانس، به Box, 1954a, 1954b نیز مراجعه کنید. هسو، 1938).

مورد خاص: همبستگی میانگین ها و واریانس ها.مواقعی هست که افآمار می تواند گمراه کردناین زمانی اتفاق می افتد که میانگین سلول های طراحی با واریانس همبستگی داشته باشد. مدول تحلیل واریانسبه شما امکان می دهد برای تشخیص چنین همبستگی، نمودارهای پراکندگی واریانس یا انحراف معیار را در برابر میانگین ترسیم کنید. دلیل خطرناک بودن این همبستگی به شرح زیر است. بیایید تصور کنیم که 8 خانه در پلان وجود دارد که 7 خانه تقریباً میانگین یکسانی دارند و در یک سلول میانگین بسیار بالاتر از بقیه است. سپس افآزمایش ممکن است یک اثر آماری معنی دار را تشخیص دهد. اما فرض کنید که در یک سلول با مقدار متوسط ​​بزرگ، واریانس به طور قابل توجهی بزرگتر از بقیه باشد، یعنی. مقدار متوسط ​​و واریانس در سلول ها وابسته است (هر چه میانگین بالاتر باشد، واریانس بیشتر است). در این مورد، میانگین بزرگ غیرقابل اعتماد است زیرا ممکن است ناشی از واریانس زیاد در داده ها باشد. با این حال افآمار بر اساس متحدواریانس درون سلولی میانگین کل را به دست می‌آورد، اگرچه آزمایش‌های مبتنی بر واریانس درون هر سلول، همه تفاوت‌های میانگین را معنی‌دار در نظر نمی‌گیرند.

این نوع داده ها (میانگین بزرگ و واریانس بزرگ) اغلب زمانی اتفاق می افتد که مشاهدات پرت وجود داشته باشد. یک یا دو مشاهدات پرت میانگین را تا حد زیادی تغییر داده و واریانس را بسیار افزایش می دهد.

همگنی واریانس و کوواریانس

مفروضاتطرح‌های چند متغیره با معیارهای وابسته به چند متغیره نیز فرض همگنی واریانس را که قبلاً توضیح داده شد، اعمال می‌کنند. با این حال، از آنجایی که متغیرهای وابسته چند متغیره وجود دارد، همچنین لازم است که همبستگی های متقابل آنها (کوواریانس) در تمام سلول های طرح یکنواخت باشد. مدول تحلیل واریانسراه های مختلفی برای آزمایش این مفروضات ارائه می دهد.

اثرات اختلال. آنالوگ چند بعدی اف- معیار - آزمون λ Wilks. اطلاعات زیادی در مورد استحکام تست Wilks λ با توجه به نقض مفروضات فوق وجود ندارد. با این حال، از تفسیر ماژول نتایج تحلیل واریانسمعمولاً بر اساس اهمیت اثرات تک متغیره است (پس از تعیین اهمیت معیار کلی)، بحث استحکام عمدتاً به تحلیل واریانس تک متغیره مربوط می شود. بنابراین، اهمیت اثرات تک متغیره باید به دقت بررسی شود.

مورد ویژه: تحلیل کوواریانس.به ویژه نقض شدید همگنی واریانس/کوواریانس زمانی رخ می دهد که متغیرهای کمکی در طرح گنجانده شوند. به طور خاص، اگر همبستگی بین متغیرهای کمکی و معیارهای وابسته در بین سلول‌های طراحی متفاوت باشد، ممکن است تفسیر نادرست از نتایج حاصل شود. به یاد داشته باشید که تجزیه و تحلیل کوواریانس اساساً یک تجزیه و تحلیل رگرسیون را در هر سلول انجام می دهد تا آن قسمت از واریانس را که توسط متغیر کمکی محاسبه می شود جدا کند. فرض همگنی واریانس/کوواریانس فرض می‌کند که این تحلیل رگرسیون تحت محدودیت زیر انجام می‌شود: همه معادلات رگرسیون (شیب‌ها) برای همه سلول‌ها یکسان هستند. اگر این فرض نشود، ممکن است خطاهای بزرگ ظاهر شود. مدول تحلیل واریانسچندین معیار ویژه برای آزمایش این فرض دارد. استفاده از این معیارها برای اطمینان از اینکه معادلات رگرسیون برای سلول های مختلف تقریباً یکسان است، توصیه می شود.

کرویت و تقارن پیچیده: دلایل استفاده از رویکرد چند متغیره برای اندازه گیری های مکرر در تحلیل واریانس

در طرح‌هایی که شامل فاکتورهای اندازه‌گیری مکرر با بیش از دو سطح هستند، استفاده از ANOVA تک متغیره به مفروضات اضافی نیاز دارد: فرض تقارن ترکیبی و فرض کروی. این فرضیات به ندرت برآورده می شوند (به زیر مراجعه کنید). بنابراین، در سال‌های اخیر، تحلیل واریانس چند متغیره در چنین طرح‌هایی محبوبیت پیدا کرده است (هر دو رویکرد در ماژول ترکیب شده‌اند. تحلیل واریانس).

فرض تقارن مختلطفرض تقارن مرکب این است که واریانس‌ها (مشترک در گروه‌ها) و کوواریانس‌ها (مشترک در درون گروه‌ها) برای اندازه‌های مختلف تکراری همگن هستند (یکسان). این یک شرط کافی برای معتبر بودن آزمون F تک متغیره برای اندازه گیری های مکرر است (یعنی مقادیر F گزارش شده به طور متوسط ​​با توزیع F مطابقت دارند). اما در این حالت این شرط ضروری نیست.

فرض کروی بودن.فرض کروی بودن شرط لازم و کافی برای معتبر بودن آزمون F است. این واقعیت شامل این واقعیت است که در درون گروه ها همه مشاهدات مستقل و به طور مساوی توزیع شده اند. ماهیت این مفروضات، و تأثیر نقض آنها، معمولاً به خوبی در کتاب‌های ANOVA توضیح داده نشده است - این موارد در پاراگراف‌های بعدی پوشش داده خواهد شد. همچنین نشان داده خواهد شد که نتایج یک رویکرد تک متغیره ممکن است با نتایج یک رویکرد چند متغیره متفاوت باشد و توضیح داده خواهد شد که این به چه معناست.

لزوم استقلال فرضیه ها.روش کلی برای تجزیه و تحلیل داده ها در ANOVA است اتصالات مدل. اگر نسبت به مدلی که با داده ها مطابقت دارد، برخی وجود دارد پیشینفرضیه ها، سپس واریانس برای آزمون این فرضیه ها (معیارهای اثرات اصلی، تعاملات) تقسیم می شود. از نقطه نظر محاسباتی، این رویکرد مجموعه ای از تضادها (مجموعه ای از مقایسه ابزارهای طرح) را ایجاد می کند. با این حال، اگر تضادها مستقل از یکدیگر نباشند، تقسیم بندی واریانس ها بی معنی می شود. به عنوان مثال، اگر دو تضاد آو بیکسان هستند و قسمت مربوطه از واریانس استخراج می شود، سپس همان قسمت دو بار استخراج می شود. به عنوان مثال، شناسایی دو فرضیه احمقانه و بیهوده است: "میانگین در سلول 1 بیشتر از میانگین سلول 2 است" و "میانگین سلول 1 از میانگین سلول 2 بیشتر است." بنابراین فرضیه ها باید مستقل یا متعامد باشند.

فرضیه های مستقل در اندازه گیری های مکرر.الگوریتم عمومی پیاده سازی شده در ماژول تحلیل واریانس، سعی خواهد کرد تضادهای مستقل (متعامد) برای هر اثر ایجاد کند. برای عامل اندازه گیری های مکرر، این تضادها فرضیه های زیادی را در مورد آن ارائه می دهند تفاوتبین سطوح عامل مورد نظر با این حال، اگر این تفاوت ها در گروه ها همبستگی داشته باشند، تضادهای حاصل دیگر مستقل نیستند. به عنوان مثال، در تدریسی که دانش آموزان در یک ترم سه بار اندازه گیری می شوند، ممکن است این اتفاق بیفتد که تغییر بین اندازه گیری های 1 و 2 با تغییر بین اندازه گیری های 2 و 3 موضوعات درسی همبستگی منفی داشته باشد. کسانی که بیشتر مطالب را بین بعد 1 و 2 تسلط داشتند، در مدت زمانی که بین بعد 2 و 3 سپری شد، به بخش کوچکتری تسلط داشتند. در واقع، برای اکثر مواردی که ANOVA برای اندازه‌گیری‌های مکرر استفاده می‌شود، می‌توان فرض کرد که تغییرات در سطوح بین افراد مرتبط است. با این حال، هنگامی که این اتفاق می افتد، فرض تقارن پیچیده و فرض کروی برقرار نمی شود و تضادهای مستقل را نمی توان محاسبه کرد.

تاثیر تخلفات و راه های اصلاح آن.هنگامی که مفروضات تقارن پیچیده یا کروی برآورده نمی شوند، ANOVA ممکن است نتایج اشتباهی ایجاد کند. قبل از اینکه رویه های چند متغیره به اندازه کافی توسعه یابند، چندین فرض برای جبران نقض این مفروضات پیشنهاد شد. (به عنوان مثال به Greenhouse & Geisser، 1959 و Huynh & Feldt، 1970 مراجعه کنید). این روش ها هنوز به طور گسترده مورد استفاده قرار می گیرند (به همین دلیل است که آنها در ماژول ارائه می شوند تحلیل واریانس).

رویکرد تحلیل واریانس چند متغیره برای اندازه گیری های مکرر.به طور کلی، مشکلات تقارن و کروی پیچیده به این واقعیت مربوط می شود که مجموعه تضادهای موجود در مطالعه تأثیر عوامل اندازه گیری های مکرر (با بیش از 2 سطح) مستقل از یکدیگر نیستند. با این حال، در صورت استفاده نیازی به مستقل بودن ندارند چند بعدیآزمونی برای آزمایش همزمان اهمیت آماری دو یا چند تضاد فاکتور اندازه گیری مکرر. به همین دلیل است که تکنیک های تحلیل واریانس چند متغیره به طور فزاینده ای برای آزمایش اهمیت عوامل اندازه گیری مکرر تک متغیره با بیش از 2 سطح استفاده می شود. این رویکرد به طور گسترده پذیرفته شده است زیرا به طور کلی به تقارن یا کروی پیچیده نیاز ندارد.

مواردی که نمی توان از روش تحلیل واریانس چند متغیره استفاده کرد.نمونه‌هایی (طرح‌هایی) وجود دارد که نمی‌توان از روش تحلیل واریانس چند متغیره استفاده کرد. اینها معمولاً مواردی هستند که تعداد کمی از موضوعات در طراحی و سطوح زیادی در فاکتور اندازه گیری های مکرر وجود دارد. ممکن است مشاهدات بسیار کمی برای انجام یک تحلیل چند متغیره وجود داشته باشد. به عنوان مثال، اگر 12 موضوع وجود دارد، پ = 4 عامل اندازه گیری های مکرر، و هر عامل دارای است ک = 3 سطوح سپس تعامل 4 عامل "مصرف" خواهد شد (ک-1) ص = 2 4 = 16 درجه آزادی. با این حال، تنها 12 موضوع وجود دارد، بنابراین آزمون چند متغیره را نمی توان در این مثال انجام داد. مدول تحلیل واریانسبه طور مستقل این مشاهدات را تشخیص داده و تنها معیارهای یک بعدی را محاسبه می کند.

تفاوت در نتایج تک متغیره و چند متغیره.اگر یک مطالعه شامل تعداد زیادی اندازه گیری های مکرر باشد، ممکن است مواردی وجود داشته باشد که رویکرد ANOVA اندازه گیری های تکراری تک متغیره نتایجی ایجاد کند که بسیار متفاوت از نتایج به دست آمده با رویکرد چند متغیره است. این بدان معناست که تفاوت‌های بین سطوح اندازه‌گیری‌های مکرر متناظر در بین موضوعات مرتبط است. گاهی اوقات این واقعیت مورد توجه مستقل است.

تحلیل واریانس چند متغیره و مدل سازی معادلات ساختاری

در سال‌های اخیر، مدل‌سازی معادلات ساختاری به‌عنوان جایگزینی برای تحلیل واریانس چند متغیره رایج شده است (برای مثال، باگوزی و یی، 1989؛ باگوزی، یی، و سینگ، 1991؛ کول، ماکسول، آروی، و سالاس، 1993 را ببینید). . این رویکرد امکان آزمون فرضیه ها را نه تنها در مورد میانگین در گروه های مختلف، بلکه در مورد ماتریس های همبستگی متغیرهای وابسته نیز فراهم می کند. به عنوان مثال، می توان مفروضات همگنی واریانس ها و کوواریانس ها را راحت کرد و به صراحت واریانس های خطا و کوواریانس ها را در مدل برای هر گروه گنجاند. مدول آمارمدل سازی معادلات ساختاری (SEPATH) (رجوع کنید به جلد سوم) چنین تحلیلی را اجازه می دهد.

استفاده از آمار در این یادداشت با یک مثال مقطعی نشان داده خواهد شد. فرض کنید شما مدیر تولید Perfect Parachute هستید. چتر نجات از الیاف مصنوعی تولید شده توسط چهار تامین کننده مختلف ساخته شده است. یکی از ویژگی های اصلی چتر نجات، قدرت آن است. شما باید اطمینان حاصل کنید که تمام الیاف عرضه شده از استحکام یکسانی برخوردار هستند. برای پاسخ به این سوال، باید یک طرح آزمایشی برای اندازه گیری مقاومت چترهای بافته شده از الیاف مصنوعی از تامین کنندگان مختلف طراحی شود. اطلاعات به دست آمده از این آزمایش مشخص می کند که کدام تامین کننده بادوام ترین چتر نجات را ارائه می دهد.

بسیاری از کاربردها شامل آزمایشاتی هستند که چندین گروه یا سطوح یک عامل واحد را در نظر می گیرند. برخی از عوامل، مانند دمای پخت سرامیک، ممکن است سطوح عددی متعددی داشته باشند (یعنی 300 درجه، 350 درجه، 400 درجه و 450 درجه). عوامل دیگر، مانند محل اقلام در یک سوپرمارکت، ممکن است دارای سطوح طبقه بندی شوند (به عنوان مثال، اولین تامین کننده، تامین کننده دوم، تامین کننده سوم، تامین کننده چهارم). آزمایش‌های تک عاملی که در آن واحدهای آزمایشی به‌طور تصادفی به گروه‌ها یا سطوح عاملی اختصاص داده می‌شوند، کاملاً تصادفی نامیده می‌شوند.

استفادهاف- معیارهایی برای ارزیابی تفاوت بین چندین انتظار ریاضی

اگر اندازه‌گیری‌های عددی عامل در گروه‌ها پیوسته باشد و برخی شرایط اضافی برآورده شود، از تحلیل واریانس (ANOVA) برای مقایسه انتظارات ریاضی چند گروه استفاده می‌شود. یکتجزیه و تحلیل o f وارینس). آنالیز واریانس با استفاده از طرح‌های کاملاً تصادفی، روش ANOVA یک طرفه نامیده می‌شود. از برخی جهات، اصطلاح آنالیز واریانس یک نام اشتباه است زیرا تفاوت‌ها را بین مقادیر مورد انتظار گروه‌ها مقایسه می‌کند تا بین واریانس‌ها. با این حال، مقایسه انتظارات ریاضی دقیقاً بر اساس تجزیه و تحلیل تغییرات داده ها انجام می شود. در روش ANOVA، کل تغییرات در نتایج اندازه گیری به گروه های بین گروهی و درون گروهی تقسیم می شود (شکل 1). تغییرات درون گروهی با خطای تجربی توضیح داده می شود و تغییرات بین گروهی با تاثیرات شرایط تجربی توضیح داده می شود. سمبل باتعداد گروه ها را نشان می دهد.

برنج. 1. پارتیشن بندی تنوع در یک آزمایش کاملا تصادفی

یادداشت را با فرمت یا نمونه ها در قالب دانلود کنید

بیایید وانمود کنیم که باگروه ها از جمعیت های مستقلی استخراج می شوند که دارای توزیع نرمال و واریانس برابر هستند. فرضیه صفر این است که انتظارات ریاضی جمعیت ها یکسان است: H 0: μ 1 = μ 2 = ... = μ s. فرضیه جایگزین بیان می کند که همه انتظارات ریاضی یکسان نیستند: H 1: همه μ j یکسان نیستند j= 1، 2، ...، s).

در شکل شکل 2 فرضیه صفر واقعی را در مورد انتظارات ریاضی پنج گروه مقایسه شده ارائه می دهد، مشروط بر اینکه جمعیت ها دارای توزیع نرمال و واریانس یکسان باشند. پنج جمعیت مرتبط با سطوح مختلف عامل یکسان هستند. در نتیجه، آنها بر روی یکدیگر قرار می گیرند و انتظارات ریاضی، تنوع و شکل یکسانی دارند.

برنج. 2. پنج جمعیت عمومی انتظارات ریاضی یکسانی دارند: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

از طرف دیگر، فرض کنید که در واقع فرضیه صفر نادرست است، به طوری که سطح چهارم دارای بالاترین مقدار مورد انتظار، سطح اول دارای مقدار مورد انتظار کمی کمتر، و سطوح باقیمانده دارای مقادیر مورد انتظار یکسان و حتی کمتر هستند. شکل 3). توجه داشته باشید که به استثنای مقادیر مورد انتظار، هر پنج جمعیت یکسان هستند (یعنی تنوع و شکل یکسانی دارند).

برنج. 3. تأثیر شرایط آزمایشی مشاهده می شود: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

هنگام آزمون فرضیه برابری انتظارات ریاضی چندین جمعیت عمومی، کل تغییرات به دو بخش تقسیم می‌شود: تنوع بین گروهی، به دلیل تفاوت بین گروه‌ها، و تنوع درون گروهی، به دلیل تفاوت بین عناصر متعلق به همان گروه. تغییرات کل با مجموع مجموع مربع ها بیان می شود (SST - مجموع مربعات کل). از آنجایی که فرضیه صفر این است که انتظارات ریاضی از همه باگروه ها با یکدیگر برابر هستند، تغییرات کل برابر است با مجموع اختلاف مجذور بین مشاهدات فردی و میانگین کلی (میانگین میانگین ها)، محاسبه شده برای همه نمونه ها. تنوع کامل:

جایی که - میانگین عمومی X ij - من-e مشاهده در j-گروه یا سطح، n j- تعداد مشاهدات در jگروه ام، n- تعداد کل مشاهدات در همه گروه ها (یعنی n = n 1 + n 2 + … + n c), با- تعداد گروه ها یا سطوح مورد مطالعه.

تنوع بین گروهیکه معمولاً مجموع مربع‌های بین گروهی (SSA - مجموع مربع‌های میان گروه‌ها) نامیده می‌شود، برابر است با مجموع مجذورات تفاوت بین میانگین نمونه هر گروه. jو میانگین کلی ضرب در حجم گروه مربوطه n j:

جایی که با- تعداد گروه ها یا سطوح مورد مطالعه، n j- تعداد مشاهدات در jگروه ام، j- ارزش متوسط jگروه ام، - میانگین کلی

تنوع درون گروهیکه معمولاً مجموع مربع‌های درون گروهی (SSW – مجموع مربع‌های درون گروه‌ها) نامیده می‌شود، برابر است با مجموع مربع‌های تفاوت بین عناصر هر گروه و میانگین نمونه این گروه. j:

جایی که ایکسij - منعنصر ام jگروه ام، j- ارزش متوسط jگروه ام

از آنجایی که با هم مقایسه می شوند باسطوح عاملی، مجموع مربعات بین گروهی دارد s – 1درجه آزادی. هر کدام از باسطوح دارد n j – 1 درجه آزادی، بنابراین مجموع مربعات درون گروهی دارد n- بادرجات آزادی و

علاوه بر این، مجموع مجموع مربع است n – 1 درجات آزادی، از هر مشاهده ایکسijبا میانگین کلی محاسبه شده در همه مقایسه می شود nمشاهدات اگر هر یک از این مجموع بر تعداد متناظر درجات آزادی تقسیم شود، سه نوع پراکندگی ایجاد می شود: بین گروهی(میانگین مربع در میان - MSA)، درون گروهی(میانگین مربع درون - MSW) و پر شده(میانگین مجذور کل - MST):

علیرغم این واقعیت که هدف اصلی تحلیل واریانس مقایسه انتظارات ریاضی است باگروه ها به منظور شناسایی تأثیر شرایط آزمایشی، نام آن به این دلیل است که ابزار اصلی آنالیز واریانس انواع مختلف است. اگر فرضیه صفر درست باشد و بین انتظارات ریاضی باگروه ها تفاوت معنی داری ندارند، هر سه واریانس - MSA، MSW و MST - تخمین واریانس هستند. σ 2ذاتی در داده های تحلیل شده بنابراین، برای آزمون فرضیه صفر H 0: μ 1 = μ 2 = ... = μ sو فرضیه جایگزین H 1: همه μ j یکسان نیستند j = 1, 2, …, با، محاسبه آمار ضروری است اف-معیار، که نسبت دو واریانس MSA و MSW است. تست اف-آمار در تحلیل واریانس یک طرفه

آمار اف- مشروط به معیارها اف-توزیع با s – 1درجات آزادی در شمارشگر M.S.A.و n – sدرجات آزادی در مخرج M.S.W.. برای سطح معناداری معین α، فرضیه صفر رد می شود اگر محاسبه شود اف افU، ذاتی اف-توزیع با s – 1 n – sدرجات آزادی در مخرج بنابراین، همانطور که در شکل نشان داده شده است. 4، قانون تصمیم گیری به صورت زیر فرموله می شود: فرضیه صفر H 0رد شد اگر F>FU; در غیر این صورت رد نمی شود.

برنج. 4. منطقه بحرانی تجزیه و تحلیل واریانس هنگام آزمایش یک فرضیه H 0

اگر فرضیه صفر H 0درست است، محاسبه شده است اف-آمار نزدیک به 1 است، زیرا صورت و مخرج آن تخمین هایی از یک مقدار هستند - پراکندگی σ 2 ذاتی در داده های تحلیل شده. اگر فرضیه صفر H 0نادرست است (و بین انتظارات ریاضی گروه های مختلف تفاوت معناداری وجود دارد)، محاسبه می شود اف-آمار بسیار بزرگتر از یک خواهد بود، زیرا کسر آن، MSA، علاوه بر تغییرپذیری طبیعی داده ها، تأثیر شرایط آزمایشی یا تفاوت بین گروه ها را تخمین می زند، در حالی که مخرج MSW تنها تغییرپذیری طبیعی داده ها را تخمین می زند. . بنابراین، روش ANOVA است اف-معیاری که در آن، در سطح معناداری معین α، فرضیه صفر رد می شود اگر اف-آمار بیشتر از مقدار بحرانی بالایی است افU، ذاتی اف-توزیع با s – 1درجات آزادی در صورتگر و n – sدرجات آزادی در مخرج، همانطور که در شکل نشان داده شده است. 4.

برای نشان دادن آنالیز واریانس یک طرفه، اجازه دهید به سناریویی که در ابتدای یادداشت ذکر شد بازگردیم. هدف از این آزمایش تعیین این است که آیا چترهای بافته شده از الیاف مصنوعی به دست آمده از تامین کنندگان مختلف دارای استحکام یکسانی هستند یا خیر. هر گروه پنج چتر نجات دارد. گروه ها بر اساس تامین کننده تقسیم می شوند - تامین کننده 1، تامین کننده 2، تامین کننده 3 و تامین کننده 4. استحکام چتر نجات ها با استفاده از دستگاه خاصی که پارچه را از نظر پارگی در هر دو طرف آزمایش می کند، اندازه گیری می شود. نیروی لازم برای شکستن چتر نجات در مقیاس خاصی اندازه گیری می شود. هر چه نیروی شکست بیشتر باشد، چتر نجات قوی تر است. اکسل به شما امکان تجزیه و تحلیل را می دهد افآمار در یک کلیک. از طریق منو بروید داده هاتحلیل داده هاو خط را انتخاب کنید ANOVA یک طرفه، پنجره باز شده را پر کنید (شکل 5). نتایج تجربی (استحکام شکست)، برخی از آمارهای توصیفی و نتایج تحلیل واریانس یک طرفه در شکل 1 ارائه شده است. 6.

برنج. 5. پنجره بسته تحلیل واریانس یک طرفه آنالیزبرتری داشتن

برنج. 6. شاخص های مقاومت چترهای بافته شده از الیاف مصنوعی به دست آمده از تامین کنندگان مختلف، آمار توصیفی و نتایج تحلیل واریانس یک طرفه

تجزیه و تحلیل شکل 6 نشان می دهد که تفاوتی بین میانگین نمونه وجود دارد. میانگین استحکام الیاف به دست آمده از تامین کننده اول 19.52، ​​از دوم - 24.26، از سوم - 22.84 و از چهارم - 21.16 است. آیا این تفاوت از نظر آماری معنادار است؟ توزیع نیروی گسیختگی در نمودار پراکندگی نشان داده شده است (شکل 7). به وضوح تفاوت بین گروه ها و درون گروه ها را نشان می دهد. اگر اندازه هر گروه بزرگتر بود، می توان از نمودار ساقه و برگ، نمودار جعبه یا طرح زنگ برای تجزیه و تحلیل آنها استفاده کرد.

برنج. 7. نمودار پراکندگی قدرت برای چترهای بافته شده از الیاف مصنوعی به دست آمده از چهار تامین کننده.

فرضیه صفر بیان می کند که تفاوت معنی داری بین میانگین امتیازات قدرت وجود ندارد: H 0: μ 1 = μ 2 = μ 3 = μ 4. یک فرضیه جایگزین این است که حداقل یک تامین کننده وجود دارد که میانگین استحکام الیافش با بقیه متفاوت است: H 1: همه μ j یکسان نیستند ( j = 1, 2, …, با).

میانگین کلی (شکل 6 را ببینید) = AVERAGE(D12:D15) = 21.945; برای تعیین، شما همچنین می توانید میانگین تمام 20 عدد اصلی: = AVERAGE (A3:D7). مقادیر واریانس محاسبه می شود بسته تحلیلیو در بشقاب منعکس می شوند تحلیل واریانس(شکل 6 را ببینید): SSA = 63.286، SSW = 97.504، SST = 160.790 (به ستون مراجعه کنید اس اسجداول تحلیل واریانسشکل 6). میانگین ها با تقسیم این مجموع مربع ها بر تعداد مناسب درجه آزادی محاسبه می شوند. از آنجا که با= 4، a n= 20، مقادیر درجه آزادی زیر را به دست می آوریم. برای SSA: s – 1= 3; برای SSW: n–c= 16; برای SST: n – 1= 19 (به ستون مراجعه کنید df). بنابراین: MSA = SSA / ( s - 1)= 21.095; MSW = SSW / ( n–c) = 6.094; MST = SST / ( n – 1) = 8.463 (به ستون مراجعه کنید ام‌اس). اف-statistics = MSA / MSW = 3.462 (به ستون مراجعه کنید اف).

ارزش بحرانی بالاتر افU، مشخصه از اف- توزیع، با فرمول =F.OBR(0.95;3;16) = 3.239 تعیین می شود. پارامترهای تابع =F.OBR(): α = 0.05، صورت دارای سه درجه آزادی، و مخرج دارای 16 است. بنابراین، محاسبه اف-آمار برابر با 3.462 از مقدار بحرانی بالایی فراتر می رود افU= 3.239، فرضیه صفر رد می شود (شکل 8).

برنج. 8. منطقه بحرانی تحلیل واریانس در سطح معنی داری 0.05 در صورتی که صورت دارای سه درجه آزادی و مخرج آن 16- باشد.

آر- ارزش، یعنی این احتمال وجود دارد که اگر فرضیه صفر درست باشد اف-آمار نه کمتر از 3.46، برابر با 0.041 یا 4.1٪ (به ستون مراجعه کنید مقدار pجداول تحلیل واریانسشکل 6). از آنجایی که این مقدار از سطح معناداری α = 5% تجاوز نمی کند، فرضیه صفر رد می شود. علاوه بر این، آر-value نشان می دهد که احتمال تشخیص چنین یا بیشتر تفاوت بین انتظارات ریاضی جمعیت های عمومی به شرط یکسان بودن آنها برابر با 4.1٪ است.

بنابراین. بین چهار میانگین نمونه تفاوت وجود دارد. فرضیه صفر این بود که تمام انتظارات ریاضی چهار جمعیت برابر است. تحت این شرایط، معیاری از تغییرپذیری کل (یعنی تغییرات کل SST) قدرت همه چتر نجات ها با جمع مجذور اختلاف بین هر مشاهده محاسبه می شود. X ijو میانگین کلی . سپس کل تغییرات به دو جزء تقسیم شد (شکل 1 را ببینید). مولفه اول تنوع بین گروهی در SSA و دومی تنوع درون گروهی در SSW بود.

چه چیزی تنوع در داده ها را توضیح می دهد؟ به عبارت دیگر، چرا همه مشاهدات یکسان نیستند؟ یکی از دلایل این است که شرکت های مختلف الیاف با قدرت های متفاوت را عرضه می کنند. این تا حدی توضیح می‌دهد که چرا گروه‌ها انتظارات ریاضی متفاوتی دارند: هرچه تأثیر شرایط آزمایشی قوی‌تر باشد، تفاوت بین انتظارات ریاضی گروه‌ها بیشتر است. یکی دیگر از دلایل تغییرپذیری داده ها، تغییرپذیری طبیعی هر فرآیند، در این مورد تولید چتر نجات است. حتی اگر همه الیاف از یک تامین کننده خریداری شده باشند، استحکام آنها یکسان نخواهد بود، همه چیزهای دیگر برابر هستند. از آنجا که این اثر در هر گروه رخ می دهد، به آن تنوع درون گروهی می گویند.

تفاوت بین میانگین های نمونه را SSA تنوع بین گروهی می نامند. بخشی از تغییرات درون گروهی، همانطور که قبلاً نشان داده شد، با تعلق داده ها به گروه های مختلف توضیح داده می شود. با این حال، حتی اگر گروه ها دقیقاً یکسان باشند (یعنی فرضیه صفر درست بود)، تنوع بین گروهی همچنان وجود خواهد داشت. دلیل این امر تنوع طبیعی فرآیند ساخت چتر نجات است. از آنجا که نمونه ها متفاوت هستند، میانگین نمونه آنها با یکدیگر متفاوت است. بنابراین، اگر فرضیه صفر درست باشد، متغیرهای بین گروهی و درون گروهی تخمینی از تنوع جمعیت را نشان می دهند. اگر فرضیه صفر نادرست باشد، فرضیه بین گروهی بیشتر خواهد بود. این واقعیت است که زیربنای آن است اف-معیارهای مقایسه تفاوت بین انتظارات ریاضی چند گروه.

پس از انجام یک ANOVA یک طرفه و یافتن تفاوت معنی‌دار بین شرکت‌ها، ناشناخته باقی می‌ماند که کدام تامین‌کننده تفاوت قابل‌توجهی با سایرین دارد. ما فقط می دانیم که انتظارات ریاضی جمعیت عمومی برابر نیست. به عبارت دیگر، حداقل یکی از انتظارات ریاضی تفاوت قابل توجهی با بقیه دارد. برای تعیین اینکه کدام تامین کننده با بقیه متفاوت است، می توانید استفاده کنید روش توکی، با استفاده از مقایسه های زوجی بین تامین کنندگان. این روش توسط جان توکی توسعه داده شد. متعاقبا، او و K. Kramer به طور مستقل این روش را برای موقعیت هایی که در آن اندازه نمونه با یکدیگر متفاوت است، اصلاح کردند.

مقایسه چندگانه: روش توکی-کرامر

در سناریوی ما، از آنالیز واریانس یک طرفه برای مقایسه قدرت چتر نجات استفاده شد. پس از یافتن تفاوت های معنادار بین انتظارات ریاضی چهار گروه، لازم است مشخص شود که کدام گروه ها با یکدیگر متفاوت هستند. اگرچه راه های مختلفی برای حل این مشکل وجود دارد، اما ما فقط روش مقایسه چندگانه Tukey-Kramer را شرح می دهیم. این روش نمونه ای از روش های مقایسه تعقیبی است زیرا فرضیه مورد آزمایش پس از تجزیه و تحلیل داده ها فرموله می شود. روش Tukey-Kramer اجازه می دهد تا همه جفت گروه ها به طور همزمان با هم مقایسه شوند. در مرحله اول، تفاوت ها محاسبه می شود ایکسj -ایکسj، جایی که j ≠j، بین انتظارات ریاضی s(s – 1)/2گروه ها. محدوده بحرانیروش Tukey-Kramer با فرمول محاسبه می شود:

جایی که Q U- مقدار بحرانی بالای توزیع محدوده دانشجویی که دارد بادرجات آزادی در صورتگر و n - بادرجات آزادی در مخرج

اگر اندازه های نمونه یکسان نباشد، محدوده بحرانی برای هر جفت انتظارات ریاضی به طور جداگانه محاسبه می شود. در آخرین مرحله، هر یک از s(s – 1)/2جفت انتظارات ریاضی با محدوده بحرانی مربوطه مقایسه می شوند. عناصر یک جفت به طور قابل توجهی متفاوت در نظر گرفته می شوند اگر مدول اختلاف | X j -ایکسj| بین آنها از محدوده بحرانی فراتر می رود.

اجازه دهید رویه Tukey-Kramer را برای مشکل قدرت چتر نجات اعمال کنیم. از آنجایی که شرکت چتر نجات چهار تامین کننده دارد، 4 (4 - 1)/2 = 6 جفت تامین کننده برای بررسی وجود دارد (شکل 9).

برنج. 9. مقایسه دو به دو میانگین نمونه

از آنجایی که همه گروه ها حجم یکسانی دارند (یعنی همه n j = n j، کافی است فقط یک محدوده بحرانی را محاسبه کنید. برای انجام این کار، طبق جدول ANOVA(شکل 6) مقدار MSW = 6.094 را تعیین می کنیم. سپس مقدار را پیدا می کنیم Q Uدر α = 0.05، با= 4 (تعداد درجات آزادی در صورت حساب) و n- با= 20 – 4 = 16 (تعداد درجات آزادی در مخرج). متأسفانه، تابع مربوطه را در اکسل پیدا نکردم، بنابراین از جدول (شکل 10) استفاده کردم.

برنج. 10. ارزش بحرانی محدوده دانشجویی Q U

ما گرفتیم:

از آنجایی که فقط 4.74 > 4.47 (نگاه کنید به جدول پایین شکل 9)، تفاوت آماری معنی داری بین تامین کننده اول و دوم وجود دارد. همه جفت های دیگر دارای ابزارهای نمونه هستند که به ما اجازه نمی دهند در مورد تفاوت های آنها صحبت کنیم. در نتیجه، میانگین استحکام چترهای بافته شده از الیاف خریداری شده از تامین کننده اول به طور قابل توجهی کمتر از دومی است.

شرایط لازم برای تحلیل واریانس یک طرفه

هنگام حل مشکل استحکام چترها، بررسی نکردیم که آیا شرایطی که در آن می توان از یک عامل تک فاکتوری استفاده کرد یا خیر. اف-معیار چگونه می دانید که می توانید از یک عامل استفاده کنید؟ اف-معیار هنگام تجزیه و تحلیل داده های تجربی خاص؟ تک عاملی اف- معیار تنها در صورتی قابل اعمال است که سه فرض اساسی برآورده شود: داده های تجربی باید تصادفی و مستقل باشند، توزیع نرمال داشته باشند و واریانس آنها باید برابر باشد.

اولین حدس - تصادفی بودن و استقلال داده- همیشه باید انجام شود، زیرا صحت هر آزمایش به تصادفی بودن انتخاب و/یا فرآیند تصادفی سازی بستگی دارد. برای جلوگیری از سوگیری نتایج، ضروری است که داده ها از آن استخراج شوند باجمعیت های عمومی به صورت تصادفی و مستقل از یکدیگر. به طور مشابه، داده ها باید به طور تصادفی در سراسر توزیع شوند باسطوح عامل مورد علاقه ما (گروه های آزمایشی). نقض این شرایط می تواند به طور جدی نتایج تحلیل واریانس را مخدوش کند.

حدس دوم - عادی بودن- به این معنی است که داده ها از جمعیت های معمولی توزیع شده استخراج می شوند. با توجه به تی-معیارها، تحلیل واریانس یک طرفه بر اساس اف-معیار نسبتاً به نقض این شرایط حساس است. اگر توزیع به طور قابل توجهی از نرمال انحراف نداشته باشد، سطح معنی داری است اف-معیار کمی تغییر می کند، به خصوص اگر حجم نمونه به اندازه کافی بزرگ باشد. در صورت نقض جدی شرط نرمال بودن توزیع باید اعمال شود.

حدس سوم - همگنی واریانس- به این معنی است که واریانس های هر جمعیت با یکدیگر برابر است (یعنی σ 1 2 = σ 2 2 = ... = σ j 2). این فرض به فرد اجازه می‌دهد تا تصمیم بگیرد که آیا واریانس‌های درون گروهی را جدا یا جمع کند. اگر اندازه گروه ها یکسان باشد، شرط همگنی واریانس تأثیر کمی بر نتایج به دست آمده با استفاده از اف-شاخص. با این حال، اگر حجم نمونه نابرابر باشد، نقض شرط برابری واریانس ها می تواند نتایج تحلیل واریانس را به طور جدی مخدوش کند. بنابراین، باید تلاش کرد تا اندازه نمونه برابر باشد. یکی از روش های بررسی فرض همگنی واریانس، معیار است لویندر زیر شرح داده شده است.

اگر از هر سه شرط فقط شرط همگنی واریانس نقض شود، رویه ای مشابه تی-معیار با استفاده از واریانس جداگانه (برای جزئیات بیشتر، نگاه کنید به). با این حال، اگر مفروضات توزیع نرمال و همگنی واریانس به طور همزمان نقض شود، لازم است داده ها نرمال سازی شده و تفاوت بین واریانس ها کاهش یابد یا یک روش ناپارامتریک اعمال شود.

آزمون لوین برای آزمایش همگنی واریانس

با اينكه اف- معیار نسبتاً در برابر نقض شرط برابری واریانس ها در گروه ها مقاوم است؛ نقض فاحش این فرض به طور قابل توجهی بر سطح اهمیت و قدرت معیار تأثیر می گذارد. شاید یکی از قدرتمندترین معیارها باشد لوین. برای بررسی برابری واریانس ها باجمعیت های عمومی، فرضیه های زیر را آزمایش می کنیم:

Н 0: σ 1 2 = σ 2 2 = … = σj 2

H 1: نه همه σ j 2همان هستند ( j = 1, 2, …, با)

آزمون Levene اصلاح شده مبتنی بر این بیانیه است که اگر تغییرپذیری در گروه ها یکسان باشد، می توان از تحلیل واریانس مقادیر مطلق تفاوت بین مشاهدات و میانه های گروه برای آزمون فرضیه صفر برابری واریانس ها استفاده کرد. بنابراین، ابتدا باید مقادیر مطلق تفاوت بین مشاهدات و میانه ها را در هر گروه محاسبه کنید و سپس یک آنالیز واریانس یک طرفه را بر روی مقادیر مطلق حاصل از تفاوت ها انجام دهید. برای نشان دادن معیار لوین، اجازه دهید به سناریویی که در ابتدای یادداشت توضیح داده شد، برگردیم. با استفاده از داده های ارائه شده در شکل. 6، ما یک تجزیه و تحلیل مشابه انجام خواهیم داد، اما در رابطه با ماژول های تفاوت در داده های اولیه و میانه ها برای هر نمونه به طور جداگانه (شکل 11).

آخرین مطالب در بخش:

باکتری ها، تنوع آنها
باکتری ها، تنوع آنها

طبقه بندی باکتری ها بر اساس شکل همه باکتری ها بر اساس شکلشان به 3 گروه کروی یا کوکسی میله ای شکل یا میله ای پیچ خورده تقسیم می شوند.

تلفظ نماد به عنوان نام عنصر در لاتین به نظر می رسد
تلفظ نماد به عنوان نام عنصر در لاتین به نظر می رسد

همچنین ببینید: فهرست عناصر شیمیایی بر اساس عدد اتمی و فهرست الفبایی عناصر شیمیایی محتویات 1 نمادهای استفاده شده در این...

فریتز پرلز و گشتالت درمانی
فریتز پرلز و گشتالت درمانی

واژه ناآشنا «گشتالت» هنوز گوش بسیاری را آزار می دهد، اگرچه اگر به آن نگاه کنید، گشتالت درمانی چندان غریبه نیست. بسیاری از مفاهیم و تکنیک ها ...