Дисперсионен анализ. Курсова работа: Дисперсионен анализ Многовариантен дисперсионен анализ

Дисперсионният анализ е набор от статистически методи, предназначени да тестват хипотези за връзката между определени характеристики и изследваните фактори, които нямат количествено описание, както и да установят степента на влияние на факторите и тяхното взаимодействие. В специализираната литература често се нарича ANOVA (от английското наименование Analysis of Variations). Този метод е разработен за първи път от Р. Фишер през 1925 г.

Видове и критерии за дисперсионен анализ

Този метод се използва за изследване на връзката между качествени (номинални) характеристики и количествена (непрекъсната) променлива. По същество тества хипотезата за равенството на средните аритметични на няколко извадки. По този начин може да се разглежда като параметричен критерий за сравняване на центровете на няколко проби наведнъж. Ако този метод се използва за две проби, резултатите от дисперсионния анализ ще бъдат идентични с резултатите от t-теста на Student. Въпреки това, за разлика от други критерии, това изследване ни позволява да проучим проблема по-подробно.

Анализът на дисперсията в статистиката се основава на закона: сумата от квадратите на отклоненията на комбинираната извадка е равна на сумата от квадратите на вътрешногруповите отклонения и сумата от квадратите на междугруповите отклонения. Проучването използва теста на Fisher, за да установи значимостта на разликата между междугруповите и вътрешногруповите дисперсии. Необходимите предпоставки за това обаче са нормалност на разпределението и хомоскедастичност (равенство на дисперсии) на извадките. Различават се едномерен (еднофакторен) дисперсионен анализ и многомерен (многофакторен). Първият разглежда зависимостта на изследваната стойност от една характеристика, вторият - от много наведнъж, а също така ни позволява да идентифицираме връзката между тях.

Фактори

Факторите са контролирани обстоятелства, които влияят върху крайния резултат. Неговото ниво или метод на обработка е стойност, която характеризира конкретно проявление на това състояние. Тези числа обикновено се представят в номинална или ординална измервателна скала. Често изходните стойности се измерват в количествени или порядъчни скали. Тогава възниква проблемът с групирането на изходните данни в редица наблюдения, които съответстват на приблизително еднакви числени стойности. Ако броят на групите се приеме за прекалено голям, тогава броят на наблюденията в тях може да се окаже недостатъчен за получаване на надеждни резултати. Ако вземете твърде малък брой, това може да доведе до загуба на значими характеристики на влияние върху системата. Конкретният начин за групиране на данни зависи от количеството и характера на вариацията в стойностите. Броят и размерът на интервалите при едномерния анализ най-често се определят от принципа на равните интервали или принципа на равните честоти.

Анализ на дисперсионни проблеми

Така че има случаи, когато трябва да сравните две или повече проби. Тогава е препоръчително да се използва дисперсионен анализ. Името на метода показва, че изводите се правят въз основа на изследването на компонентите на дисперсията. Същността на изследването е, че общото изменение на показателя се разделя на съставни части, които съответстват на действието на всеки отделен фактор. Нека разгледаме редица проблеми, които се решават чрез типичен дисперсионен анализ.

Пример 1

Цехът разполага с множество автоматични машини, които произвеждат определен детайл. Размерът на всяка част е случайна променлива, която зависи от настройката на всяка машина и случайните отклонения, които възникват по време на производствения процес на частите. Необходимо е въз основа на данните от измерванията на размерите на частите да се определи дали машините са конфигурирани по същия начин.

Пример 2

По време на производството на електрическо устройство се използват различни видове изолационна хартия: кондензаторна, електрическа и др. Устройството може да бъде импрегнирано с различни вещества: епоксидна смола, лак, смола ML-2 и др. Течовете могат да бъдат отстранени под вакуум при повишено налягане, с нагряване. Импрегнирането може да се извърши чрез потапяне във лак, под непрекъсната струя лак и т.н. Електрическият апарат като цяло се запълва с определено съединение, като има няколко варианта. Индикатори за качество са електрическата якост на изолацията, температурата на прегряване на намотката в работен режим и редица други. При разработването на технологичния процес на производство на устройства е необходимо да се определи как всеки от изброените фактори влияе върху работата на устройството.

Пример 3

Тролейбусното депо обслужва няколко тролейбусни маршрута. Те управляват различни видове тролейбуси, а 125 инспектори събират таксите. Ръководството на депото се интересува от въпроса: как да се сравнят икономическите показатели на работата на всеки контрольор (приход), като се вземат предвид различни маршрути и различни видове тролейбуси? Как да се определи икономическата целесъобразност на производството на тролейбуси от определен тип по определен маршрут? Как да установим разумни изисквания за размера на приходите, които кондукторът носи по всеки маршрут в различните видове тролейбуси?

Задачата при избора на метод е как да се получи максимална информация относно влиянието на всеки фактор върху крайния резултат, да се определят числените характеристики на такова влияние, тяхната надеждност при минимални разходи и във възможно най-кратко време. Методите за дисперсионен анализ позволяват решаването на такива проблеми.

Едномерен анализ

Целта на изследването е да се оцени степента на влияние на конкретен случай върху анализирания преглед. Друга цел на едномерния анализ може да бъде да се сравнят две или повече обстоятелства едно с друго, за да се определи разликата в тяхното въздействие върху припомнянето. Ако нулевата хипотеза бъде отхвърлена, следващата стъпка е количествено определяне и конструиране на доверителни интервали за получените характеристики. В случаите, когато нулевата хипотеза не може да бъде отхвърлена, тя обикновено се приема и се прави заключение за естеството на влиянието.

Еднопосочният анализ на дисперсията може да се превърне в непараметричен аналог на ранговия метод на Kruskal-Wallis. Той е разработен от американския математик Уилям Крускал и икономиста Уилсън Уолис през 1952 г. Този критерий е предназначен да тества нулевата хипотеза за равенството на ефектите върху изследваните проби с неизвестни, но равни средни стойности. В този случай броят на пробите трябва да бъде повече от две.

Критерият Jonckheere-Terpstra е предложен независимо от холандския математик T. J. Terpstra през 1952 г. и британския психолог E. R. Jonckheere през 1954 г. Той се използва, когато е известно предварително, че съществуващите групи резултати са подредени според нарастването на влиянието на изследван фактор, който се измерва по ординална скала.

M - Тестът на Бартлет, предложен от британския статистик Морис Стивънсън Бартлет през 1937 г., се използва за проверка на нулевата хипотеза за равенството на дисперсиите на няколко нормални популации, от които са взети изследваните проби, обикновено с различни размери (броя на всяка пробата трябва да бъде най-малко четири).

G - Тест на Кокран, който е открит от американеца Уилям Гемел Кокран през 1941 г. Използва се за проверка на нулевата хипотеза за равенството на дисперсиите на нормалните популации в независими извадки с еднакъв размер.

Непараметричният тест на Левен, предложен от американския математик Хауърд Левен през 1960 г., е алтернатива на теста на Бартлет в условия, при които няма увереност, че изследваните проби са обект на нормално разпределение.

През 1974 г. американските статистици Мортън Б. Браун и Алън Б. Форсайт предлагат тест (тест на Браун-Форсайт), който е малко по-различен от теста на Ливен.

Двуфакторен анализ

Двупосочен анализ на дисперсията се използва за свързани нормално разпределени проби. На практика често се използват сложни таблици на този метод, по-специално тези, в които всяка клетка съдържа набор от данни (повтарящи се измервания), съответстващи на стойности на фиксирано ниво. Ако предположенията, необходими за прилагане на двупосочен анализ на дисперсията, не са изпълнени, тогава използвайте непараметричния рангов тест на Фридман (Фридман, Кендъл и Смит), разработен от американския икономист Милтън Фридман в края на 1930 г. Този тест не зависи от типа на разпространение.

Предполага се само, че разпределението на стойностите е идентично и непрекъснато и че самите те са независими една от друга. При тестване на нулевата хипотеза изходните данни се представят под формата на правоъгълна матрица, в която редовете отговарят на нивата на фактор B, а колоните съответстват на нива на A. Всяка клетка от таблицата (блок) може да бъде резултат от измервания на параметри на един обект или на група обекти с постоянни стойности на нивата на двата фактора. В този случай съответните данни се представят като средни стойности на определен параметър за всички измерения или обекти на изследваната проба. За да се приложи изходният критерий, е необходимо да се премине от преките резултати от измерванията към техния ранг. Класирането се извършва за всеки ред поотделно, т.е. стойностите се подреждат за всяка фиксирана стойност.

Тестът на Пейдж (L-тест), предложен от американския статистик Е. Б. Пейдж през 1963 г., е предназначен да тества нулевата хипотеза. За големи проби се използва приближението на Page. Те, при спазване на реалността на съответните нулеви хипотези, се подчиняват на стандартното нормално разпределение. В случай, че редовете на изходната таблица имат еднакви стойности, е необходимо да се използват средни рангове. В този случай точността на заключенията ще бъде по-лоша, колкото по-голям е броят на такива съвпадения.

Q - критерий на Cochran, предложен от W. Cochran през 1937 г. Използва се в случаите, когато групи от еднородни субекти са изложени на въздействия, чийто брой надвишава две и за които са възможни два варианта на обратна връзка - условно отрицателна (0) и условно положителен (1) . Нулевата хипотеза се състои в равенство на ефектите от лечението. Двупосочният анализ на дисперсията дава възможност да се определи наличието на ефекти от лечението, но не дава възможност да се определи за кои конкретни колони съществува този ефект. За решаването на този проблем се използва методът на множество уравнения на Шефе за свързани проби.

Многовариантен анализ

Проблемът с многовариантния анализ на дисперсията възниква, когато трябва да определите ефекта на две или повече условия върху определена случайна променлива. Проучването включва наличието на една зависима случайна променлива, измерена по скала за разлика или съотношение, и няколко независими променливи, всяка от които е изразена по именна или рангова скала. Дисперсионният анализ на данните е доста развит раздел от математическата статистика, който има много възможности. Изследователската концепция е обща както за еднофакторни, така и за многофакторни. Същността му се състои в това, че общата дисперсия се разделя на компоненти, което съответства на определено групиране на данни. Всяко групиране на данни има свой собствен модел. Тук ще разгледаме само основните положения, необходими за разбирането и практическото използване на най-използваните му опции.

Вариационният анализ на факторите изисква доста внимателно отношение към събирането и представянето на входните данни и особено към интерпретацията на резултатите. За разлика от еднофакторния тест, резултатите от който могат условно да бъдат поставени в определена последователност, резултатите от двуфакторния тест изискват по-сложно представяне. Ситуацията става още по-сложна, когато има три, четири или повече обстоятелства. Поради това е доста рядко да се включат повече от три (четири) условия в модел. Пример може да бъде появата на резонанс при определена стойност на капацитета и индуктивността на електрически кръг; проявата на химическа реакция с определен набор от елементи, от които е изградена системата; появата на аномални ефекти в сложни системи при определено стечение на обстоятелствата. Наличието на взаимодействие може радикално да промени модела на системата и понякога да доведе до преосмисляне на природата на явленията, с които експериментаторът има работа.

Многовариантен дисперсионен анализ с повтарящи се експерименти

Данните от измерванията често могат да бъдат групирани не по два, а по по-голям брой фактори. По този начин, ако разгледаме дисперсионния анализ на експлоатационния живот на гумите на тролейбусните колела, като вземем предвид обстоятелствата (фабриката за производство и маршрута, по който се експлоатират гумите), тогава можем да отделим като отделно условие сезона, през който гумите са експлоатирани (а именно: зимна и лятна експлоатация). В резултат на това ще имаме проблем с трифакторния метод.

Ако има повече условия, подходът е същият като при двуфакторния анализ. Във всички случаи те се опитват да опростят модела. Феноменът на взаимодействие на два фактора не се появява толкова често, а тройното взаимодействие се среща само в изключителни случаи. Включете онези взаимодействия, за които има предишна информация и основателни причини да я вземете предвид в модела. Процесът на идентифициране на отделни фактори и тяхното отчитане е относително прост. Поради това често има желание да се подчертаят повече обстоятелства. Не бива да се увличате с това. Колкото повече условия, толкова по-малко надежден става моделът и толкова по-голяма е вероятността от грешка. Самият модел, който включва голям брой независими променливи, става доста сложен за интерпретация и неудобен за практическа употреба.

Обща идея за дисперсионен анализ

Анализът на дисперсията в статистиката е метод за получаване на резултати от наблюдение в зависимост от различни едновременно действащи обстоятелства и оценка на тяхното влияние. Контролирана променлива, която съответства на метода на въздействие върху обекта на изследване и придобива определена стойност за определен период от време, се нарича фактор. Те могат да бъдат качествени и количествени. Нивата на количествените условия придобиват определено значение в цифрова скала. Примери за това са температура, налягане при пресоване, количество вещество. Качествените фактори са различни вещества, различни технологични методи, устройства, пълнители. Нивата им съответстват на скала от имена.

Качеството може да включва и вида на опаковъчния материал и условията на съхранение на лекарствената форма. Също така е рационално да се включи степента на смилане на суровините, фракционният състав на гранулите, които имат количествено значение, но е трудно да се регулират, ако се използва количествена скала. Броят на качествените фактори зависи от вида на лекарствената форма, както и от физическите и технологичните свойства на лекарствените вещества. Например, таблетки могат да бъдат получени от кристални вещества чрез директно пресоване. В този случай е достатъчно да изберете плъзгащи и смазващи вещества.

Примери за качествени фактори за различни видове лекарствени форми

  • Тинктури.Състав на екстрагента, тип екстрактор, метод за приготвяне на суровината, метод на производство, метод на филтриране.
  • Екстракти (течни, гъсти, сухи).Състав на екстрагента, метод на екстракция, вид на инсталацията, начин на отстраняване на екстрагента и баластните вещества.
  • Хапчета.Състав от ексципиенти, пълнители, дезинтегранти, свързващи вещества, лубриканти и лубриканти. Метод за получаване на таблетки, тип технологично оборудване. Тип обвивка и нейните компоненти, филмообразуватели, пигменти, багрила, пластификатори, разтворители.
  • Инжекционни разтвори.Вид на разтворителя, метод на филтриране, естество на стабилизаторите и консервантите, условия на стерилизация, начин на пълнене на ампули.
  • супозитории.Състав на основата на супозиториите, метод за производство на супозитории, пълнители, опаковка.
  • Мехлеми.Състав на основата, структурни компоненти, метод за приготвяне на мехлема, вид оборудване, опаковка.
  • Капсули.Вид материал на обвивката, метод за производство на капсули, вид пластификатор, консервант, багрило.
  • Линименти.Начин на приготвяне, състав, вид оборудване, вид емулгатор.
  • Суспензии.Вид разтворител, вид стабилизатор, дисперсионен метод.

Примери за качествени фактори и техните нива, изследвани по време на производствения процес на таблета

  • Бакпулвер.Картофено нишесте, бяла глина, смес от натриев бикарбонат с лимонена киселина, основен магнезиев карбонат.
  • Свързващ разтвор.Вода, нишестена паста, захарен сироп, разтвор на метилцелулоза, разтвор на хидроксипропилметилцелулоза, разтвор на поливинилпиролидон, разтвор на поливинил алкохол.
  • Плъзгащо се вещество.Аеросил, нишесте, талк.
  • Пълнител.Захар, глюкоза, лактоза, натриев хлорид, калциев фосфат.
  • Лубрикант.Стеаринова киселина, полиетилен гликол, парафин.

Модели на дисперсионен анализ при изследване на нивото на държавна конкурентоспособност

Един от най-важните критерии за оценка на състоянието на държавата, чрез който се оценява нивото на нейното благосъстояние и социално-икономическо развитие, е конкурентоспособността, тоест набор от свойства, присъщи на националната икономика, които определят състоянието на държавата. способността да се конкурира с други страни. След като се определи мястото и ролята на държавата на световния пазар, е възможно да се установи ясна стратегия за осигуряване на икономическа сигурност в международен мащаб, тъй като това е ключът към положителните отношения между Русия и всички играчи на световния пазар: инвеститорите , кредитори и правителства.

За да се сравни нивото на конкурентоспособност на държавите, страните се класират с помощта на комплексни индекси, които включват различни претеглени показатели. Тези индекси се основават на ключови фактори, влияещи върху икономическата, политическата и др. ситуация. Набор от модели за изследване на конкурентоспособността на държавата включва използването на методи за многовариантен статистически анализ (по-специално анализ на дисперсията (статистика), иконометрично моделиране, вземане на решения) и включва следните основни етапи:

  1. Формиране на система от показатели.
  2. Оценка и прогнозиране на показателите за конкурентоспособност на държавата.
  3. Сравнение на показателите за конкурентоспособност на държавите.

Сега нека разгледаме съдържанието на моделите на всеки от етапите на този комплекс.

На първия етапс помощта на експертни методи на изследване се формира добре обоснован набор от икономически показатели за оценка на конкурентоспособността на държавата, като се вземат предвид спецификите на нейното развитие въз основа на международни рейтинги и данни от статистически служби, отразяващи състоянието на системата като цяло и неговите процеси. Изборът на тези показатели е оправдан от необходимостта да се изберат тези, които най-пълно, от практическа гледна точка, ни позволяват да определим нивото на държавата, нейната инвестиционна привлекателност и възможността за относителна локализация на съществуващите потенциални и реални заплахи.

Основните показатели на международните рейтингови системи са индексите:

  1. Глобална конкурентоспособност (GC).
  2. Икономическа свобода (IES).
  3. Човешко развитие (HDI).
  4. Възприемане на корупцията (CPC).
  5. Вътрешни и външни заплахи (IETH).
  6. Международен потенциал за влияние (IPIP).

Втора фазаосигурява оценка и прогнозиране на показателите за конкурентоспособност на държавата според международните рейтинги за изследваните 139 страни по света.

Трети етапосигурява сравнение на условията на конкурентоспособност на държавите с помощта на методи на корелационен и регресионен анализ.

Използвайки резултатите от изследването, е възможно да се определи характерът на процесите като цяло и за отделните компоненти на конкурентоспособността на държавата; тествайте хипотезата за влиянието на факторите и техните връзки на подходящо ниво на значимост.

Прилагането на предложения набор от модели ще позволи не само да се оцени текущата ситуация на нивото на конкурентоспособност и инвестиционната привлекателност на държавите, но и да се анализират недостатъците в управлението, да се предотвратят грешки от грешни решения и да се предотврати развитието на криза в състояние.

Дисперсионен анализ

1. Концепция за дисперсионен анализ

Дисперсионен анализе анализ на изменчивостта на даден признак под въздействието на всякакви контролирани променливи фактори. В чуждестранната литература дисперсионният анализ често се нарича ANOVA, което се превежда като анализ на променливостта (Analysis of Variance).

ANOVA проблемсе състои в изолиране на променливост от различен вид от общата променливост на черта:

а) променливост, дължаща се на действието на всяка от изследваните независими променливи;

б) променливост, дължаща се на взаимодействието на изследваните независими променливи;

в) случайна променливост, дължаща се на всички други неизвестни променливи.

Променливостта, дължаща се на действието на изследваните променливи и тяхното взаимодействие, е свързана със случайната променливост. Индикатор за тази връзка е F тестът на Фишер.

Формулата за изчисляване на критерия F включва оценки на дисперсиите, т.е. параметрите на разпределението на атрибута, следователно критерият F е параметричен критерий.

Колкото повече променливостта на дадена черта се дължи на изследваните променливи (фактори) или тяхното взаимодействие, толкова по-висока е емпирични критериални стойности.

Нула хипотезата при анализа на дисперсията ще гласи, че средните стойности на изследваната ефективна характеристика са еднакви във всички градации.

алтернатива хипотезата ще твърди, че средните стойности на получената характеристика в различните градации на изследвания фактор са различни.

Анализът на дисперсията ни позволява да посочим промяна в характеристика, но не показва посокатези промени.

Нека започнем нашето разглеждане на дисперсионния анализ с най-простия случай, когато изучаваме действието само на единпроменлива (един фактор).

2. Еднопосочен дисперсионен анализ за несвързани проби

2.1. Цел на метода

Методът на еднофакторния дисперсионен анализ се използва в случаите, когато се изследват промени в ефективна характеристика под влияние на променящи се условия или градации на фактор. В тази версия на метода влиянието на всяка от градациите на фактора е различенпроби от предмети. Трябва да има поне три степени на фактора. (Може да има две градации, но в този случай няма да можем да установим нелинейни зависимости и изглежда по-разумно да използваме по-прости).

Непараметрична версия на този тип анализ е H тестът на Kruskal-Wallis.

Хипотези

H 0: Разликите между степени на фактор (различни условия) не са по-големи от случайни разлики във всяка група.

H 1: Разликите между факторните степени (различни условия) са по-големи от случайните разлики във всяка група.

2.2. Ограничения на еднопосочния дисперсионен анализ за несвързани проби

1. Еднопосочният анализ на дисперсията изисква най-малко три градации на фактора и поне два субекта във всяка градация.

2. Получената характеристика трябва да бъде нормално разпределена в изследваната проба.

Вярно е, че обикновено не се посочва дали говорим за разпределение на характеристиката в цялата изследвана извадка или в тази част от нея, която съставлява дисперсионния комплекс.

3. Пример за решаване на проблем с помощта на метода на еднопосочен дисперсионен анализ за несвързани проби, използвайки примера:

Три различни групи от шест субекта получиха списъци от десет думи. На първата група думите се представяха с ниска скорост - 1 дума за 5 секунди, на втората група със средна скорост - 1 дума на 2 секунди и на третата група с висока скорост - 1 дума в секунда. Беше предвидено, че ефективността на възпроизвеждане зависи от скоростта на представяне на думата. Резултатите са представени в табл. 1.

Брой възпроизведени думи маса 1

Предмет №

ниска скорост

Средната скорост

висока скорост

обща сума

H 0: Разлики в обхвата на производството на думи междугрупите не са по-изразени от случайните разлики вътревсяка група.

H1: Разлики в обема на производството на думи междугрупите са по-изразени от случайните разлики вътревсяка група. Използвайки експерименталните стойности, представени в табл. 1, ще установим някои стойности, които ще са необходими за изчисляване на критерия F.

Изчисляването на основните величини за еднопосочен дисперсионен анализ е представено в таблицата:

таблица 2

Таблица 3

Последователност от операции при еднопосочен дисперсионен анализ за несвързани проби

Често срещано в тази и следващите таблици обозначението SS е съкращение за „сума на квадрати“. Това съкращение се използва най-често в преводните източници.

СС фактозначава променливостта на характеристиката поради действието на изследвания фактор;

СС в общи линии- обща изменчивост на признака;

С C.A.-променливост поради неотчетени фактори, „случайна” или „остатъчна” променливост.

Г-ЦА- „среден квадрат“, или математическото очакване на сумата от квадрати, средната стойност на съответната SS.

df - броят на степените на свобода, които при разглеждане на непараметрични критерии обозначаваме с гръцка буква v.

Заключение: H 0 се отхвърля. H 1 се приема. Разликите в припомнянето на думи между групите са по-големи от случайните разлики във всяка група (α=0,05). И така, скоростта на представяне на думите влияе върху обема на тяхното възпроизвеждане.

Пример за решаване на проблема в Excel е представен по-долу:

Първоначални данни:

Използвайки командата: Инструменти->Анализ на данни->Еднопосочна ANOVA, получаваме следните резултати:

Обсъдените по-горе техники за тестване на статистически хипотези за значимостта на разликите между две средни имат ограничено приложение на практика. Това се дължи на факта, че за да се идентифицира ефектът на всички възможни условия и фактори върху ефективен признак, полеви и лабораторни експерименти, като правило, се извършват с помощта не на две, а на по-голям брой проби (1220 или повече). ).

Често изследователите сравняват средните стойности на няколко проби, комбинирани в един комплекс. Например, когато се изследва влиянието на различни видове и дози торове върху добивите, опитите се повтарят в различни варианти. В тези случаи сравненията по двойки стават тромави и статистическият анализ на целия комплекс изисква използването на специален метод. Този метод, разработен в математическата статистика, се нарича дисперсионен анализ. За първи път е използван от английския статистик Р. Фишер при обработката на резултатите от агрономически опити (1938 г.).

Дисперсионен анализе метод за статистическа оценка на надеждността на проявата на зависимостта на ефективна характеристика от един или повече фактори. С помощта на метода на дисперсионния анализ се проверяват статистически хипотези по отношение на средни стойности в няколко генерални съвкупности, които имат нормално разпределение.

Дисперсионният анализ е един от основните методи за статистическа оценка на експерименталните резултати. Също така все повече се използва в анализа на икономическа информация. Анализът на дисперсията дава възможност да се определи до каква степен извадковите показатели за връзката между резултантните и факторните характеристики са достатъчни за разширяване на данните, получени от извадката, към генералната съвкупност. Предимството на този метод е, че дава доста надеждни заключения от малки проби.

Чрез изследване на промяната на ефективна характеристика под влиянието на един или няколко фактора с помощта на дисперсионен анализ може да се получи, в допълнение към общите оценки на значимостта на зависимостите, също и оценка на разликите в големината на средните, които се формират на различни нива на фактори и значимостта на взаимодействието на факторите. Дисперсионният анализ се използва за изследване на зависимостите както на количествените, така и на качествените характеристики, както и на тяхната комбинация.

Същността на този метод е статистическото изследване на вероятността от влиянието на един или повече фактори, както и тяхното взаимодействие върху получената характеристика. Съгласно това с помощта на дисперсионен анализ се решават три основни задачи: 1) обща оценка на значимостта на разликите между груповите средни; 2) оценка на вероятността от взаимодействие между факторите; 3) оценка на значимостта на разликите между двойки средни. Най-често изследователите трябва да решават такива проблеми при провеждане на полеви и зоотехнически експерименти, когато се изследва влиянието на няколко фактора върху ефективен признак.

Принципната схема на дисперсионния анализ включва установяване на основните източници на вариация в ефективната характеристика и определяне на обема на вариация (сума от квадратни отклонения) според източниците на нейното формиране; определяне на броя на степените на свобода, съответстващи на компонентите на общата вариация; изчисляване на дисперсии като съотношение на съответните обеми на вариация към техния брой степени на свобода; анализ на връзката между отклоненията; оценка на достоверността на разликата между средствата и извеждане на изводи.

Тази схема се запазва както в прости модели на дисперсионен анализ, когато данните са групирани по една характеристика, така и в сложни модели, когато данните са групирани по две или повече характеристики. Въпреки това, с увеличаване на броя на груповите характеристики, процесът на разлагане на общата вариация според източниците на нейното формиране става по-сложен.

Според принципната диаграма дисперсионният анализ може да бъде представен под формата на пет последователни етапа:

1) дефиниране и разширяване на вариацията;

2) определяне на броя на степените на свобода на вариация;

3) изчисляване на дисперсии и техните съотношения;

4) анализ на отклоненията и техните връзки;

5) оценка на значимостта на разликата между средните стойности и формулиране на заключения за проверка на нулевата хипотеза.

Най-трудоемката част от дисперсионния анализ е първият етап - определяне и декомпозиране на вариацията според източниците на нейното формиране. Редът на разлагане на общия обем на вариацията беше обсъден подробно в Глава 5.

Основата за решаване на проблемите на дисперсионния анализ е законът за разширяване (добавяне) на вариация, според който общата вариация (флуктуации) на резултантния атрибут се разделя на две: вариацията, причинена от действието на фактора(ите), който се изследва и вариацията, причинена от действието на случайни причини, т.е

Да приемем, че изследваната популация е разделена според факторните характеристики на няколко групи, всяка от които се характеризира със собствена средна стойност на получената характеристика. В същото време промяната на тези стойности може да се обясни с два вида причини: тези, които действат върху ефективния знак систематично и могат да бъдат коригирани по време на експеримента, и тези, които не могат да бъдат коригирани. Очевидно е, че междугруповата (факторна или систематична) вариация зависи предимно от действието на изследвания фактор, а вътрешногруповата (остатъчна или случайна) вариация зависи предимно от действието на случайни фактори.

За да се оцени надеждността на разликите между груповите средни стойности, е необходимо да се определят междугруповите и вътрешногруповите вариации. Ако междугруповата (факторна) вариация значително надвишава вътрешногруповата (остатъчна) вариация, тогава факторът е повлиял на получената характеристика, променяйки значително стойностите на груповите средни стойности. Но възниква въпросът каква е връзката между междугруповите и вътрешногруповите вариации, която може да се счита за достатъчна, за да се заключи надеждността (значимостта) на разликите между груповите средни стойности.

За да се оцени значимостта на разликите между средните стойности и да се формулират заключения за проверка на нулевата хипотеза (H0:x1 = x2 =... = xn) при дисперсионния анализ се използва своеобразен стандарт - G-критерият, законът за разпределение на което е установено от Р. Фишер. Този критерий е съотношението на две вариации: факторна, генерирана от действието на изследвания фактор, и остатъчна, дължаща се на действието на случайни причини:

Дисперсионно отношение Γ = £>u : Американският статистик Снедекор предложи да се обозначи £*2 с буквата G в чест на изобретателя на дисперсионния анализ Р. Фишър.

Дисперсиите °2 io2 са оценки на дисперсията на популацията. Ако проби с вариации °2 °2 са направени от една и съща обща популация, където вариацията на стойностите е случайна, тогава несъответствието в стойностите °2 °2 също е случайно.

Ако един експеримент тества влиянието на няколко фактора (A, B, C и т.н.) върху ефективна характеристика едновременно, тогава дисперсията, дължаща се на действието на всеки от тях, трябва да бъде сравнима с °e.gP, това е

Ако стойността на факторната дисперсия е значително по-голяма от остатъка, тогава факторът значително е повлиял на резултантния атрибут и обратно.

В многофакторните експерименти, в допълнение към вариацията, дължаща се на действието на всеки фактор, почти винаги има вариация, дължаща се на взаимодействието на факторите ($ав: ^лс ^вс $ліс). Същността на взаимодействието е, че ефектът на един фактор се променя значително на различни нива на втория (например ефективността на качеството на почвата при различни дози торове).

Взаимодействието на факторите също трябва да се оцени чрез сравняване на съответните дисперсии 3 ^v.gr:

При изчисляване на действителната стойност на B-критерия, по-голямата от дисперсиите се взема в числителя, така че B > 1. Очевидно е, че колкото по-голям е B-критерият, толкова по-значителни са разликите между дисперсиите. Ако B = 1, тогава въпросът за оценка на значимостта на разликите във дисперсиите отпада.

За да се определят границите на случайните колебания в съотношението на дисперсиите, G. Fischer разработи специални таблици за B-разпределение (Приложения 4 и 5). Критерият би бил функционално свързан с вероятността и зависи от броя на степените на свобода на вариация k1и k2 от двете сравнявани дисперсии. Обикновено се използват две таблици, за да се направят изводи относно изключително високата стойност на критерия за нива на значимост от 0,05 и 0,01. Ниво на значимост от 0,05 (или 5%) означава, че само в 5 от 100 случая критерий B може да приеме стойност, равна или по-висока от посочената в таблицата. Намаляването на нивото на значимост от 0,05 на 0,01 води до повишаване на стойността на критерия между две дисперсии поради ефекта само на случайни причини.

Стойността на критерия също зависи пряко от броя на степените на свобода на двете дисперсии, които се сравняват. Ако броят на степените на свобода клони към безкрайност (k-me), тогава отношението B за две дисперсии клони към единица.

Табличната стойност на критерий Б показва възможната произволна стойност на съотношението на две дисперсии при дадено ниво на значимост и съответния брой степени на свобода за всяка от сравняваните дисперсии. Посочените таблици показват стойността на B за проби, направени от една и съща обща популация, където причините за промените в стойностите са само случайни.

Стойността на Γ се намира от таблиците (Приложения 4 и 5) в пресечната точка на съответната колона (броят на степените на свобода за по-голяма дисперсия - k1) и реда (броят на степените на свобода за по-малка дисперсия - k2 ). Така че, ако по-голямата дисперсия (числител Г) е k1 = 4, а по-малката дисперсия (знаменател Г) е k2 = 9, то Г на ниво на значимост а = 0,05 ще бъде 3,63 (Приложение 4). И така, в резултат на случайни причини, тъй като извадките са малки, дисперсията на една проба може, при ниво на значимост от 5%, да надвиши дисперсията за втората проба с 3,63 пъти. Когато нивото на значимост намалее от 0,05 на 0,01, табличната стойност на критерий G, както е отбелязано по-горе, ще се увеличи. По този начин, при еднакви степени на свобода k1 = 4 и k2 = 9 и a = 0,01, табличната стойност на критерия G ще бъде 6,99 (Приложение 5).

Нека разгледаме процедурата за определяне на броя на степените на свобода при дисперсионния анализ. Броят на степените на свобода, който съответства на общата сума на квадратите на отклоненията, се разлага на съответните компоненти подобно на разлагането на сумите на квадратите на отклоненията (^total = No^gr + ]¥vhr), т.е. общият брой степени на свобода (k") се разлага на броя степени на свобода за междугрупови (k1) и вътрешногрупови (k2) вариации.

По този начин, ако извадкова популация, състояща се от ннаблюдения, разделени на T групи (брой експериментални опции) и П подгрупи (брой повторения), тогава броят на степените на свобода k съответно ще бъде:

а) за общата сума на квадратите на отклоненията (s7zag)

б) за междугруповата сума на квадратите на отклоненията ^m.gP)

в) за вътрешногруповата сума на квадратите на отклоненията V v.gR)

Според правилото за добавяне на вариации:

Например, ако в един експеримент са формирани четири варианта на експеримента (t = 4) в пет повторения всеки (n = 5), а общият брой наблюдения е N = = T o p = 4 * 5 = 20, тогава броят на степените на свобода е съответно равен на:

Познавайки сумата от квадратните отклонения и броя на степените на свобода, можем да определим безпристрастни (коригирани) оценки за три вариации:

Нулевата хипотеза H0 се тества с помощта на критерий B по същия начин, както с помощта на t-теста на Student. За да се вземе решение за проверка на H0, е необходимо да се изчисли действителната стойност на критерия и да се сравни с табличната стойност Ba за приетото ниво на значимост a и броя на степените на свобода k1и k2 за две дисперсии.

Ако Bfaq > Ba, тогава, в съответствие с приетото ниво на значимост, можем да заключим, че разликите в дисперсиите на извадката се определят не само от случайни фактори; те са значими. В този случай нулевата хипотеза се отхвърля и има основание да се твърди, че факторът значително влияе върху получената характеристика. Ако< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Използването на определен модел за дисперсионен анализ зависи както от броя на изследваните фактори, така и от метода на вземане на проби.

c В зависимост от броя на факторите, които определят вариацията на получената характеристика, извадките могат да бъдат формирани според един, два или повече фактора. Според това дисперсионният анализ се разделя на еднофакторен и многофакторен. В противен случай се нарича още еднофакторен и многофакторен дисперсионен комплекс.

Схемата на разлагане на общата вариация зависи от образуването на групи. То може да бъде случайно (наблюденията на една група не са свързани с наблюденията на втората група) и неслучайно (наблюденията на две проби са свързани помежду си от общите експериментални условия). Съответно се получават независими и зависими проби. Могат да се формират независими извадки както с равен, така и с нечетен брой. Формирането на зависими извадки предполага техния еднакъв размер.

Ако групите са формирани в произволен ред, тогава общият обем на вариация на резултантния признак включва, наред с факторната (междугруповата) и остатъчната вариация, вариацията на повторенията, т.е.

На практика в повечето случаи е необходимо да се вземат предвид зависими извадки, когато условията за групи и подгрупи са изравнени. И така, при полеви експерименти целият обект е разделен на блокове с най-разнообразни условия. В този случай всеки вариант на експеримента получава равни възможности да бъде представен във всички блокове, като по този начин изравнява условията за всички тествани варианти на експеримента. Този метод за конструиране на експеримент се нарича рандомизиран блоков метод. По подобен начин се провеждат експерименти с животни.

При обработката на социално-икономическите данни по метода на дисперсионния анализ е необходимо да се има предвид, че поради големия брой фактори и тяхната взаимовръзка е трудно дори при най-внимателно нивелиране на условията да се установи степента на обективност. влияние на всеки отделен фактор върху резултантната характеристика. Следователно нивото на остатъчната вариация се определя не само от случайни причини, но и от значими фактори, които не са взети предвид при конструирането на модела за анализ на вариацията. В резултат на това остатъчната вариация като база за сравнение понякога става неадекватна за предназначението си, тя е явно надценена по стойност и не може да служи като критерий за значимостта на влиянието на факторите. В тази връзка при конструирането на модели за дисперсионен анализ става актуален проблемът за избора на най-важните фактори и изравняването на условията за проява на действието на всеки от тях. Освен това. използването на дисперсионен анализ предполага нормално или близко до нормалното разпределение на изследваните статистически популации. Ако това условие не е изпълнено, тогава оценките, получени при анализа на дисперсията, ще бъдат преувеличени.

Човек може да разпознае способностите си само като се опита да ги приложи. (Сенека)

Дисперсионен анализ

Уводен преглед

В този раздел ще прегледаме основните методи, допускания и терминология на ANOVA.

Обърнете внимание, че в англоезичната литература дисперсионният анализ обикновено се нарича анализ на вариацията. Ето защо, за краткост, по-долу понякога ще използваме термина ANOVA (Ананализ о f варация) за обикновен ANOVA и термина МАНОВАза многовариантен дисперсионен анализ. В този раздел ще прегледаме последователно основните идеи на дисперсионния анализ ( ANOVA), анализ на ковариацията ( АНКОВА), многовариантен дисперсионен анализ ( МАНОВА) и многовариантен анализ на ковариацията ( МАНКОВА). След кратко обсъждане на достойнствата на контрастния анализ и post hoc тестовете, нека да разгледаме предположенията, на които се основават методите ANOVA. Към края на този раздел са обяснени предимствата на многовариантния подход за анализ на повтарящи се измервания пред традиционния едновариантен подход.

Ключови идеи

Цел на дисперсионния анализ.Основната цел на дисперсионния анализ е да се изследва значимостта на разликите между средните стойности. Глава (Глава 8) предоставя кратко въведение в изследването на статистическата значимост. Ако просто сравнявате средните стойности на две проби, анализът на дисперсията ще даде същия резултат като обикновения анализ. T- тест за независими проби (ако се сравняват две независими групи обекти или наблюдения) или T- критерий за зависими проби (ако две променливи се сравняват върху един и същи набор от обекти или наблюдения). Ако не сте запознати с тези критерии, препоръчваме ви да се обърнете към прегледа на уводната глава (Глава 9).

Откъде идва името Дисперсионен анализ? Може да изглежда странно, че процедурата за сравняване на средните се нарича дисперсионен анализ. В действителност това е така, защото когато изследваме статистическата значимост на разликите между средните стойности, ние всъщност анализираме дисперсии.

Разделяне на сумата от квадрати

За размер на извадката n дисперсията на извадката се изчислява като сумата от квадратните отклонения от средната стойност на извадката, разделена на n-1 (размер на извадката минус едно). По този начин, за фиксиран размер на извадката n, дисперсията е функция на сумата от квадрати (отклонения), означена, за краткост, СС(от английски Sum of Squares - Сума от квадрати). Основата на дисперсионния анализ е разделянето (или разделянето) на дисперсията на части. Разгледайте следния набор от данни:

Средните стойности на двете групи са значително различни (2 и 6, съответно). Сума на квадратите на отклоненията вътревсяка група е равна на 2. Събирайки ги, получаваме 4. Ако сега повторим тези изчисления като изключимгрупово членство, тоест ако изчислим ССвъз основа на общата средна стойност на двете извадки, получаваме 28. С други думи, дисперсията (сума от квадрати), базирана на променливостта в рамките на групата, води до много по-малки стойности, отколкото когато се изчислява въз основа на общата променливост (спрямо обща средна стойност). Причината за това очевидно е значителна разлика между средните и тази разлика между средните обяснява съществуващата разлика между сумите на квадратите. Всъщност, ако използвате модула за анализ на дадените данни Дисперсионен анализще се получат следните резултати:

Както се вижда от таблицата, общата сума на квадратите СС=28 се разделя на сумата от квадратите, дадена от вътрешногруповипроменливост ( 2+2=4 ; вижте втория ред на таблицата) и сумата от квадратите поради разликата в средните стойности. (28-(2+2)=24; вижте първия ред на таблицата).

СС грешки иСС ефект.Променливост в рамките на групата ( СС) обикновено се нарича дисперсия грешки.Това означава, че обикновено не може да се предвиди или обясни, когато се извършва експеримент. От друга страна, СС ефект(или променливост между групите) може да се обясни с разликите между средните стойности на изследваните групи. С други думи, принадлежност към определена група обяснявамеждугрупова изменчивост, т.к знаем, че тези групи имат различни средства.

Проверка на значимостта.Основните идеи за тестване на статистическата значимост са обсъдени в гл Основни понятия на статистиката(Глава 8). Тази глава също така обяснява причините, поради които много тестове използват съотношението на обяснена към необяснима вариация. Пример за тази употреба е самият анализ на дисперсията. Тестването за значимост в ANOVA се основава на сравняване на дисперсията, дължаща се на дисперсия между групите (наречена среден квадратичен ефектили Г-ЦАЕфект) и вариация, дължаща се на вариация в рамките на групата (наречена средна квадратна грешкаили Г-ЦАгрешка). Ако нулевата хипотеза (равенство на средните стойности в двете популации) е вярна, тогава може да се очаква сравнително малка разлика в средните стойности на извадката поради случайна вариация. Следователно, при нулевата хипотеза, дисперсията в рамките на групата практически ще съвпадне с общата дисперсия, изчислена без да се взема предвид членството в групата. Получените дисперсии в рамките на групата могат да бъдат сравнени с помощта на Е- тест, който проверява дали съотношението на дисперсията е значително по-голямо от 1. В разгледания по-горе пример Е- критерият показва, че разликата между средните е статистически значима.

Основна логика на дисперсионния анализ.За да обобщим, целта на ANOVA е да тества статистическата значимост на разликата между средните стойности (за групи или променливи). Тази проверка се извършва с помощта на дисперсионен анализ, т.е. чрез разделяне на общата дисперсия (вариация) на части, едната от които се дължи на случайна грешка (т.е. вътрешногрупова променливост), а втората е свързана с разлики в средните стойности. След това последният компонент на дисперсията се използва за анализиране на статистическата значимост на разликата между средните стойности. Ако тази разлика е значителна, нулевата хипотеза се отхвърля и се приема алтернативната хипотеза, че има разлика между средните стойности.

Зависими и независими променливи.Извикват се променливи, чиито стойности се определят чрез измервания по време на експеримент (например резултат от тест). зависимпроменливи. Променливите, които могат да бъдат контролирани в експеримент (например методи на обучение или други критерии за разделяне на наблюденията на групи), се наричат факториили независимапроменливи. Тези понятия са описани по-подробно в главата Основни понятия на статистиката(Глава 8).

Многовариантен дисперсионен анализ

В простия пример по-горе можете веднага да изчислите t-теста за независими проби, като използвате подходящата опция за модул Основни статистики и таблици.Получените резултати естествено ще съвпадат с резултатите от дисперсионния анализ. Въпреки това ANOVA съдържа гъвкави и мощни техники, които могат да се използват за много по-сложни изследвания.

Много фактори.Светът е сложен и многоизмерен по природа. Ситуациите, когато дадено явление е напълно описано от една променлива, са изключително редки. Например, ако се опитваме да научим как да отглеждаме големи домати, трябва да вземем предвид фактори, свързани с генетичната структура на растението, типа на почвата, светлината, температурата и т.н. По този начин, когато се провежда типичен експеримент, трябва да се работи с голям брой фактори. Основната причина, поради която използването на ANOVA е за предпочитане пред многократните сравнения на две проби при различни нива на факторите T- критерий е, че дисперсионният анализ е повече ефективени, за малки проби, по-информативен.

Управление на факторите.Да предположим, че в примера за анализ на две проби, обсъден по-горе, добавяме друг фактор, напр. Етаж- Пол. Нека всяка група се състои от 3 мъже и 3 жени. Дизайнът на този експеримент може да бъде представен под формата на таблица 2 на 2:

Експериментирайте. Група 1 Експериментирайте. Група 2
мъже2 6
3 7
1 5
Средно аритметично2 6
Жени4 8
5 9
3 7
Средно аритметично4 8

Преди да направите изчисленията, можете да забележите, че в този пример общата дисперсия има поне три източника:

(1) случайна грешка (в рамките на груповата дисперсия),

(2) променливост, свързана с членството в експерименталната група, и

(3) променливост, дължаща се на пола на обектите на наблюдение.

(Имайте предвид, че има друг възможен източник на променливост - взаимодействие на факторите, което ще обсъдим по-късно). Какво се случва, ако не включим етажполкато фактор в анализа и изчисляване на обичайното T- критерий? Ако изчислим суми на квадрати, игнорирайки етаж -пол(т.е. комбиниране на обекти от различен пол в една група при изчисляване на дисперсията в рамките на групата, като по този начин се получава сума от квадрати за всяка група, равна на СС=10 и общата сума на квадратите СС= 10+10 = 20), тогава получаваме по-голяма стойност на вътрешногруповата дисперсия, отколкото при по-точен анализ с допълнително разделяне на подгрупи според полу- пол(в този случай средното в рамките на групата ще бъде равно на 2, а общата сума на квадратите в рамките на групата ще бъде равна на СС = 2+2+2+2 = 8). Тази разлика се дължи на факта, че средната стойност за мъже - мъжепо-малко от средното за Жени -женски поли тази разлика в средните стойности увеличава общата променливост в рамките на групата, когато полът не се взема предвид. Контролирането на дисперсията на грешката увеличава чувствителността (мощността) на теста.

Този пример показва друго предимство на дисперсионния анализ в сравнение с конвенционалния T- критерий за две проби. Анализът на дисперсията ви позволява да изучавате всеки фактор, като контролирате стойностите на останалите фактори. Това всъщност е основната причина за неговата по-голяма статистическа сила (необходими са по-малки размери на извадката, за да се получат значими резултати). Поради тази причина дисперсионният анализ, дори на малки извадки, дава статистически по-значими резултати от простия T- критерий.

Ефекти на взаимодействие

Има още едно предимство на използването на дисперсионен анализ в сравнение с конвенционалния T- критерий: анализът на дисперсията ни позволява да открием взаимодействиемежду факторите и следователно позволява изследването на по-сложни модели. За да илюстрираме, разгледайте друг пример.

Основни ефекти, двойни (двуфакторни) взаимодействия.Да предположим, че има две групи ученици и психологически учениците от първата група са решени да изпълнят поставените задачи и са по-целеустремени от учениците от втората група, състояща се от по-мързеливи ученици. Нека произволно разделим всяка група наполовина и да дадем на едната половина от всяка група трудна задача, а на другата половина лесна. След това ще измерим колко усърдно работят учениците върху тези задачи. Средните стойности за това (измислено) проучване са показани в таблицата:

Какво заключение може да се направи от тези резултати? Можем ли да заключим, че: (1) учениците работят по-интензивно върху сложна задача; (2) Мотивираните ученици работят ли повече от мързеливите? Нито едно от тези твърдения не обхваща същността на систематичния характер на средствата, показани в таблицата. Анализирайки резултатите, би било по-правилно да се каже, че само мотивираните ученици работят по-усилено върху трудните задачи, докато само мързеливите ученици работят повече върху лесните задачи. С други думи, характерът на учениците и трудността на задачата взаимодействащивлияят взаимно върху изразходваните усилия. Това е пример взаимодействие по двойкимежду характера на учениците и трудността на задачата. Имайте предвид, че твърдения 1 и 2 описват основни ефекти.

Взаимодействия от по-висок ред.Докато взаимодействията по двойки все още са относително лесни за обяснение, взаимодействията от по-висок ред са много по-трудни за обяснение. Нека си представим, че в примера, разгледан по-горе, е въведен друг фактор етаж -Поли получихме следната таблица със средни стойности:

Какви изводи могат да се направят сега от получените резултати? Средните графики улесняват тълкуването на сложни ефекти. Модулът ANOVA ви позволява да изграждате тези графики с почти едно щракване на мишката.

Изображението в графиките по-долу представя трифакторното взаимодействие, което се изследва.

Разглеждайки графиките, можем да кажем, че при жените има взаимодействие между личността и трудността на теста: мотивираните жени работят по-усилено върху трудна задача, отколкото върху лесна. При мъжете същото взаимодействие е обратно. Вижда се, че описанието на взаимодействието между факторите става по-объркващо.

Общ начин за описание на взаимодействията.Най-общо взаимодействието между факторите се описва като промяна на един ефект под влияние на друг. В примера, разгледан по-горе, двуфакторното взаимодействие може да се опише като промяна в основния ефект на фактора, характеризиращ трудността на задачата, под влиянието на фактора, описващ характера на ученика. За взаимодействието на трите фактора от предходния параграф можем да кажем, че взаимодействието на два фактора (сложността на задачата и характера на ученика) се променя под въздействието на полПол. Ако се изследва взаимодействието на четири фактора, можем да кажем, че взаимодействието на трите фактора се променя под въздействието на четвъртия фактор, т.е. Има различни видове взаимодействия на различни нива на четвъртия фактор. Оказва се, че в много области взаимодействието на пет или дори повече фактора не е необичайно.

Сложни планове

Междугрупови и вътрешногрупови дизайни (дизайни на повтарящи се мерки)

Когато се сравняват две различни групи, обикновено се използва T- критерий за независими проби (от модула Основни статистики и таблици). Когато две променливи се сравняват върху един и същи набор от обекти (наблюдения), той се използва T-критерий за зависими проби. За анализа на дисперсията също е важно дали извадките са зависими или не. Ако има повтарящи се измервания на едни и същи променливи (при различни условия или по различно време) за същите обекти, тогава говорят за присъствие фактор на многократни измервания(също наричан вътрешногрупов фактор,тъй като вътрешногруповата сума от квадрати се изчислява, за да се оцени нейната значимост). Ако се сравняват различни групи обекти (например мъже и жени, три щама бактерии и т.н.), тогава се описва разликата между групите междугрупов фактор.Методите за изчисляване на критериите за значимост за двата описани вида фактори са различни, но общата им логика и интерпретации са еднакви.

Междугрупови и вътрешногрупови планове.В много случаи експериментът изисква включване както на фактор между субектите, така и на фактор на повтарящи се измервания в дизайна. Например, измерват се математическите умения на учениците и учениците (където етаж -Пол-междугрупов фактор) в началото и края на семестъра. Двете мерки на уменията на всеки ученик формират фактор в рамките на групата (фактор на повтарящи се измервания). Тълкуването на основните ефекти и взаимодействия за фактори между предмети и повтарящи се измервания е последователно и двата вида фактори очевидно могат да си взаимодействат помежду си (напр. жените придобиват умения в течение на един семестър, докато мъжете ги губят).

Непълни (вложени) планове

В много случаи ефектът на взаимодействие може да бъде пренебрегнат. Това се случва или когато е известно, че няма ефект на взаимодействие в популацията, или когато изпълнението е пълно факториелпланът е невъзможен. Например, изследва се ефектът на четири горивни добавки върху разхода на гориво. Избрани са четири коли и четирима водачи. Пълна факториелекспериментът изисква всяка комбинация: добавка, шофьор, кола - да се появи поне веднъж. Това изисква поне 4 x 4 x 4 = 64 групи тестове, което отнема твърде много време. Освен това е малко вероятно да има взаимодействие между водача и добавката за гориво. Като вземете предвид това, можете да използвате плана латински квадрати,който съдържа само 16 тестови групи (четирите добавки са обозначени с буквите A, B, C и D):

Латинските квадрати са описани в повечето книги за експериментален дизайн (напр. Hays, 1988; Lindman, 1974; Milliken and Johnson, 1984; Winer, 1962) и няма да бъдат обсъждани подробно тук. Имайте предвид, че латинските квадрати са Ненпъленпроекти, в които не са включени всички комбинации от факторни нива. Например водач 1 кара кола 1 само с добавка А, водач 3 кара кола 1 само с добавка С. Нива на факторите добавки ( A, B, C и D) са вложени в клетките на таблицата автомобиленх шофьор -като яйца в гнезда. Тази мнемоника е полезна за разбиране на природата вложени или вложенипланове. Модул Дисперсионен анализпредоставя прости начини за анализ на тези видове планове.

Ковариационен анализ

основна идея

В глава Ключови идеиНакратко беше обсъдена идеята за факторен контрол и как включването на адитивни фактори намалява сумата на квадратните грешки и увеличава статистическата сила на дизайна. Всичко това може да се разшири до променливи с непрекъснат набор от стойности. Когато такива непрекъснати променливи са включени като фактори в дизайна, те се наричат ковариати.

Фиксирани ковариати

Да предположим, че сравняваме математическите умения на две групи ученици, които са били обучавани по два различни учебника. Нека приемем също, че данните за коефициента на интелигентност (IQ) са налични за всеки ученик. Можете да приемете, че IQ е свързано с математическите умения и да използвате тази информация. За всяка от двете групи ученици може да се изчисли коефициентът на корелация между IQ и математическите умения. Използвайки този коефициент на корелация, е възможно да се изолира пропорцията на дисперсията в групите, която се обяснява с влиянието на IQ и необяснимата пропорция на дисперсията (вижте също Основни понятия на статистиката(Глава 8) и Основни статистики и таблици(глава 9)). Останалата част от дисперсията се използва в анализа като дисперсия на грешката. Ако има връзка между коефициента на интелигентност и математическите умения, тогава вариацията на грешката може да бъде намалена значително СС/(н-1) .

Влияние на ковариатите върхуФ- критерий. Ф-критерият оценява статистическата значимост на разликата в средните стойности в групите и се изчислява съотношението на междугруповата вариация ( Г-ЦАефект) до отклонение на грешката ( Г-ЦАгрешка) . Ако Г-ЦАгрешканамалява, например, когато се вземе предвид факторът IQ, стойността Есе увеличава.

Много ковариати.Разсъждението, използвано по-горе за една ковариата (IQ), може лесно да се разшири до множество ковариати. Например, в допълнение към IQ, можете да включите измервания на мотивация, пространствено мислене и т.н. Вместо обичайния коефициент на корелация се използва коефициент на множествена корелация.

Когато стойносттаЕ -критериите намаляват.Понякога въвеждането на ковариати в експериментален план намалява значимостта Е- критерии . Това обикновено показва, че ковариатите са свързани не само със зависимата променлива (напр. математически умения), но и с факторите (напр. различни учебници). Да предположим, че коефициентът на интелигентност се измерва в края на семестъра, след почти година обучение на две групи студенти по два различни учебника. Въпреки че учениците бяха разпределени в групи на случаен принцип, може да се окаже, че разликите в учебниците са толкова големи, че както IQ, така и математическите умения ще варират значително между групите. В този случай ковариатите не само намаляват дисперсията на грешката, но и дисперсията между групите. С други думи, след контролиране на разликите в IQ между групите, разликите в математическите умения вече не са значими. Можете да го кажете по различен начин. След „изключване” на влиянието на коефициента на интелигентност, неволно се изключва влиянието на учебника върху развитието на математическите умения.

Коригирани средни стойности.Когато ковариата влияе на фактора между субектите, трябва да се изчисли коригирани средства, т.е. тези средни стойности, които се получават след премахване на всички ковариантни оценки.

Взаимодействия между ковариати и фактори.Точно както се изследват взаимодействията между факторите, могат да бъдат изследвани взаимодействията между ковариатите и между групите фактори. Да кажем, че един от учебниците е особено подходящ за умни ученици. Вторият учебник е скучен за умните ученици, а същият учебник е труден за по-малко умните ученици. В резултат на това има положителна корелация между коефициента на интелигентност и резултатите от обучението в първата група (по-умни ученици, по-добри резултати) и нулева или лека отрицателна корелация във втората група (колкото по-умен е ученикът, толкова по-малка е вероятността да придобие математически умения от втори учебник). Някои проучвания обсъждат тази ситуация като пример за нарушение на допусканията на ковариационния анализ. Въпреки това, тъй като модулът ANOVA използва най-често срещаните методи за анализ на ковариацията, е възможно по-специално да се оцени статистическата значимост на взаимодействието между фактори и ковариати.

Променливи ковариати

Докато фиксираните ковариати се обсъждат доста често в учебниците, променливите ковариати се споменават много по-рядко. Обикновено, когато провеждаме експерименти с повтарящи се измервания, ние се интересуваме от разликите в измерванията на едни и същи количества в различни моменти от време. А именно, ние се интересуваме от значението на тези различия. Ако ковариатите се измерват едновременно с измерванията на зависимите променливи, може да се изчисли корелацията между ковариата и зависимата променлива.

Например интересът към математиката и математическите умения могат да бъдат изследвани в началото и в края на семестъра. Би било интересно да се провери дали промените в интереса към математиката са свързани с промените в математическите умения.

Модул Дисперсионен анализ V STATISTICAавтоматично оценява статистическата значимост на промените в ковариатите в дизайните, където е възможно.

Многовариантни дизайни: многовариантен анализ на дисперсията и ковариацията

Междугрупови планове

Всички примери, обсъдени по-рано, включват само една зависима променлива. Когато има няколко зависими променливи едновременно, само сложността на изчисленията се увеличава, но съдържанието и основните принципи не се променят.

Например, провежда се изследване по два различни учебника. Едновременно с това се изследва и успехът на учениците в изучаването на физика и математика. В този случай има две зависими променливи и трябва да разберете как два различни учебника им влияят едновременно. За да направите това, можете да използвате многовариантен дисперсионен анализ (MANOVA). Вместо едноизмерно Еизползва се многомерен критерий Етест (тест на Уилкс), базиран на сравнение на ковариационната матрица на грешката и междугруповата ковариационна матрица.

Ако зависимите променливи са корелирани една с друга, тогава тази корелация трябва да се вземе предвид при изчисляване на критерия за значимост. Очевидно, ако едно и също измерване се повтори два пъти, тогава не може да се получи нищо ново. Ако към съществуващо измерение се добави корелирано измерение, се получава някаква нова информация, но новата променлива съдържа излишна информация, която се отразява в ковариацията между променливите.

Тълкуване на резултатите.Ако цялостният многовариантен тест е значим, можем да заключим, че съответният ефект (напр. тип учебник) е значителен. Възникват обаче следните въпроси. Типът учебник засяга ли подобренията само в математическите умения, само в физическите умения или и в двете? Всъщност, след получаване на значим мултивариантен тест, се изследва едновариантен тест за индивидуалния основен ефект или взаимодействие. Екритерий. С други думи, зависимите променливи, които допринасят за значимостта на многовариантния тест, се изследват отделно.

Проекти за повтарящи се мерки

Ако уменията на учениците по математика и физика се измерват в началото и в края на семестъра, тогава това са повторни измервания. Изследването на критерия за значимост в такива планове е логично развитие на едномерния случай. Обърнете внимание, че техниките за многовариантен анализ на дисперсията също често се използват за изследване на значимостта на едномерни многократни измервания, имащи повече от две нива. Съответните приложения ще бъдат обсъдени по-късно в тази част.

Сумиране на променливи стойности и многовариантен дисперсионен анализ

Дори опитни потребители на едномерен и многовариантен дисперсионен анализ често намират за трудно да получат различни резултати, когато прилагат многовариантен дисперсионен анализ, например към три променливи, и когато прилагат едномерен дисперсионен анализ към сумата от тези три променливи, сякаш бяха една променлива.

Идея сумиранепроменливи е, че всяка променлива съдържа някаква истинска променлива, която се изследва, както и случайна грешка при измерване. Следователно, когато се осредняват стойностите на променливите, грешката на измерването ще бъде по-близо до 0 за всички измервания и осреднените стойности ще бъдат по-надеждни. Всъщност в този случай прилагането на ANOVA към сумата от променливи е разумна и мощна техника. Въпреки това, ако зависимите променливи са многоизмерни по природа, сумирането на стойностите на променливите е неподходящо.

Например, нека зависимите променливи се състоят от четири индикатора успех в обществото. Всеки показател характеризира напълно независим аспект от човешката дейност (например професионален успех, успех в бизнеса, семейно благополучие и др.). Добавянето на тези променливи е като добавяне на ябълки и портокали. Сумата от тези променливи не би била подходяща едноизмерна мярка. Следователно такива данни трябва да се третират като многоизмерни индикатори многовариантен дисперсионен анализ.

Контрастен анализ и post hoc тестове

Защо се сравняват отделни набори от средни стойности?

Обикновено хипотезите за експерименталните данни се формулират не просто по отношение на основните ефекти или взаимодействия. Пример за това може да бъде следната хипотеза: даден учебник подобрява математическите умения само на ученици от мъжки пол, докато друг учебник е приблизително еднакво ефективен и за двата пола, но е все още по-малко ефективен за мъжете. Може да се предвиди, че ефективността на учебника взаимодейства с пола на ученика. Тази прогноза обаче също важи природавзаимодействия. Очаква се значителна разлика между половете за учениците, използващи една книга, и практически независими резултати по пол за учениците, използващи другата книга. Този тип хипотези обикновено се изследват чрез контрастен анализ.

Анализ на контрастите

Накратко, анализът на контраста позволява да се оцени статистическата значимост на определени линейни комбинации от сложни ефекти. Контрастният анализ е основният и задължителен елемент от всеки комплексен ANOVA план. Модул Дисперсионен анализима доста разнообразни възможности за контрастен анализ, които ви позволяват да изолирате и анализирате всеки тип сравнение на средните стойности.

A posterioriсравнения

Понякога в резултат на обработка на експеримент се открива неочакван ефект. Въпреки че в повечето случаи творческият изследовател ще може да обясни всеки резултат, това не позволява допълнителен анализ и оценки за прогнозиране. Този проблем е един от онези, за които a posteriori критерии, тоест критерии, които не използват априорихипотези. За илюстрация разгледайте следния експеримент. Да приемем, че има 100 карти, съдържащи числа от 1 до 10. Поставяйки всички тези карти в заглавка, избираме произволно 5 карти 20 пъти и изчисляваме средната стойност (средната стойност на числата, написани на картите) за всяка проба. Можете ли да очаквате, че ще има две проби, чиито средни стойности са значително различни? Това е много правдоподобно! Като изберете две проби с максимална и минимална средна стойност, можете да получите разлика в средните стойности, която е много различна от разликата в средните стойности, например, на първите две проби. Тази разлика може да бъде изследвана, например, с помощта на контрастен анализ. Без да навлизаме в подробности, има няколко т.нар a posterioriкритерии, които се основават точно на първия сценарий (вземане на екстремни средни от 20 проби), т.е. тези критерии се основават на избора на най-различни средни за сравняване на всички средни в дизайна. Тези критерии се използват, за да се гарантира, че изкуствен ефект не се получава чисто случайно, например за откриване на значителна разлика между средните стойности, когато няма такава. Модул Дисперсионен анализпредлага широк набор от такива критерии. Когато се срещнат неочаквани резултати в експеримент, включващ няколко групи, тогава a posterioriпроцедури за изследване на статистическата значимост на получените резултати.

Сбор от квадрати тип I, II, III и IV

Многовариантна регресия и дисперсионен анализ

Съществува тясна връзка между метода на многовариантната регресия и дисперсионния анализ (анализ на дисперсията). И при двата метода се изучава линеен модел. Накратко, почти всички експериментални проекти могат да бъдат изследвани с помощта на многовариантна регресия. Помислете за следния прост междугрупов дизайн 2 x 2.

Д.В. А б AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Колони A и B съдържат кодове, характеризиращи нивата на фактори A и B, колона AxB съдържа произведението на две колони A и B. Можем да анализираме тези данни с помощта на многовариантна регресия. Променлива Д.В.дефинирана като зависима променлива, променливи от Апреди AxBкато независими променливи. Изследването на значимостта на регресионните коефициенти ще съвпадне с изчисленията при дисперсионния анализ на значимостта на основните ефекти на факторите АИ би ефект на взаимодействие AxB.

Небалансирани и балансирани планове

Когато изчислявате корелационната матрица за всички променливи, като данните, изобразени по-горе, ще забележите, че основните ефекти на факторите АИ би ефект на взаимодействие AxBнекорелирани. Това свойство на ефектите се нарича още ортогоналност. Казват ефектите АИ б - ортогоналенили независимаедин от друг. Ако всички ефекти в план са ортогонални един на друг, както в примера по-горе, тогава планът се казва, че е балансиран.

Балансираните планове имат „добро свойство“. Изчисленията за анализиране на такива планове са много прости. Всички изчисления се свеждат до изчисляване на корелацията между ефектите и зависимите променливи. Тъй като ефектите са ортогонални, частичните корелации (както при пълните многоизмеренрегресии) не се изчисляват. В реалния живот обаче плановете не винаги са балансирани.

Нека разгледаме реални данни с неравен брой наблюдения в клетките.

Фактор А Фактор Б
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Ако кодираме тези данни както по-горе и изчислим корелационна матрица за всички променливи, ще открием, че проектните фактори са свързани помежду си. Факторите в план вече не са ортогонални и такива планове се наричат неуравновесен.Имайте предвид, че в разглеждания пример корелацията между факторите се дължи изцяло на разликата в честотите от 1 и -1 в колоните на матрицата с данни. С други думи, експерименталните дизайни с неравномерни обеми на клетките (по-точно, непропорционални обеми) ще бъдат небалансирани, което означава, че основните ефекти и взаимодействия ще бъдат объркани. В този случай трябва да се изчисли пълната многовариантна регресия, за да се изчисли статистическата значимост на ефектите. Тук има няколко стратегии.

Сбор от квадрати тип I, II, III и IV

Тип сума на квадратитеазИIII. За да се изследва значимостта на всеки фактор в многовариантен модел, може да се изчисли частичната корелация на всеки фактор, при условие че всички други фактори вече са отчетени в модела. Можете също така да въвеждате фактори в модела стъпка по стъпка, като улавяте всички фактори, които вече са въведени в модела, и игнорирате всички други фактори. В общи линии това е разликата между Тип IIIИ Типазсума на квадратите (тази терминология е въведена в SAS, вижте например SAS, 1982; подробно обсъждане може да се намери и в Searle, 1987, p. 461; Woodward, Bonett и Brecht, 1990, p. 216; или Milliken и Джонсън, 1984 г., стр. 138).

Тип сума на квадратитеII.Следващата стратегия за формиране на „междинен“ модел се състои от: контролиране на всички основни ефекти при изследване на значимостта на единичен основен ефект; при контролиране на всички основни ефекти и всички взаимодействия по двойки при изследване на значението на отделно взаимодействие по двойки; при контролиране на всички основни ефекти на всички взаимодействия по двойки и всички взаимодействия на три фактора; при изучаване на индивидуалното взаимодействие на три фактора и др. Сумите на квадратите за ефектите, изчислени по този начин, се наричат ТипIIсбор от квадрати. Така, ТипIIсумата от квадрати контролира всички ефекти от същия ред и по-нисък, като същевременно игнорира всички ефекти от по-висок ред.

Тип сума на квадратитеIV. И накрая, за някои специални планове с липсващи клетки (непълни планове) е възможно да се изчисли т.нар. Тип IVсбор от квадрати. Този метод ще бъде обсъден по-късно във връзка с непълни дизайни (дизайни с липсващи клетки).

Тълкуване на хипотезата за сумата на квадратите от типове I, II и III

Сбор на квадрати ТипIIIнай-лесно за тълкуване. Припомнете си, че сумите на квадрати ТипIIIизследвайте ефектите след контролиране на всички други ефекти. Например след намиране на статистически значима ТипIIIефект за фактор Ав модула Дисперсионен анализ, можем да кажем, че има единичен значим ефект на фактора А, след въвеждане на всички други ефекти (фактори) и съответно интерпретирайте този ефект. Вероятно в 99% от всички приложения на ANOVA, това е типът тест, от който изследователят се интересува. Този тип сума на квадратите обикновено се изчислява по модул Дисперсионен анализпо подразбиране, независимо дали опцията е избрана Регресионен подходили не (стандартни подходи, възприети в модула Дисперсионен анализобсъдени по-долу).

Значителни ефекти, получени чрез суми от квадрати Типили ТипIIсумите на квадратите не са толкова лесни за тълкуване. Те се интерпретират най-добре в контекста на поетапна многовариантна регресия. Ако, когато се използва сумата от квадрати Типазосновният ефект на фактор B е значителен (след като фактор A е включен в модела, но преди да бъде добавено взаимодействието между A и B), можем да заключим, че има значителен основен ефект на фактор B, при условие че няма взаимодействие между фактори A и B. (Ако използвате критерия ТипIII, фактор B също се оказа значим, тогава можем да заключим, че има значим основен ефект на фактор B, след въвеждане на всички други фактори и техните взаимодействия в модела).

По отношение на хипотезата за пределните средства ТипазИ ТипIIобикновено нямат просто тълкуване. В тези случаи се казва, че не може да се интерпретира значението на ефектите, като се разглеждат само маргиналните средства. По-скоро представени стрсредните стойности са свързани със сложна хипотеза, която комбинира средни стойности и размер на извадката. Например, ТипIIхипотезите за фактор А в простия пример за дизайн 2 x 2, обсъден по-рано, биха били (вижте Woodward, Bonett и Brecht, 1990, стр. 219):

nij- брой наблюдения в клетката

uij- средна стойност в клетка

н. й- пределно средно

Без да навлизаме в твърде много подробности (за повече подробности вижте Milliken and Johnson, 1984, глава 10), ясно е, че това не са прости хипотези и в повечето случаи нито една от тях не представлява особен интерес за изследователя. Има обаче случаи, когато хипотезите Типазможе да е интересно.

Изчислителен подход по подразбиране в модула Дисперсионен анализ

По подразбиране, ако опцията не е отметната Регресионен подход, модул Дисперсионен анализизползва клетъчен среден модел. Характерно за този модел е, че сумите на квадратите за различни ефекти се изчисляват за линейни комбинации от средни стойности на клетките. В пълен факторен експеримент това води до суми от квадрати, които са същите като сумите от квадрати, обсъдени по-рано като Тип III. Въпреки това, в опцията Планирани сравнения(в прозореца Резултати от ANOVA), потребителят може да тества хипотеза срещу всяка линейна комбинация от претеглени или непретеглени средни клетки. Така потребителят може да тества не само хипотези ТипIII, но хипотези от всякакъв вид (вкл ТипIV). Този общ подход е особено полезен при изследване на дизайни с липсващи клетки (наречени непълни дизайни).

За пълни факторни дизайни този подход е полезен и когато човек иска да анализира претеглени пределни средни стойности. Да предположим например, че в простия дизайн 2 x 2, разгледан по-рано, трябва да сравним претеглени (по факторни нива б) пределни средни стойности за фактор А. Това е полезно, когато разпределението на наблюденията между клетките не е изготвено от експериментатора, а е конструирано на случаен принцип и тази случайност се отразява в разпределението на броя наблюдения по нивата на фактор В в агрегат.

Например, има фактор - възрастта на вдовиците. Възможната извадка от респонденти е разделена на две групи: под 40 години и над 40 години (фактор Б). Вторият фактор (Фактор А) в плана беше дали вдовиците са получили или не социална подкрепа от някоя агенция (някои вдовици са избрани на случаен принцип, други са служили като контролни). В този случай разпределението на вдовиците по възраст в извадката отразява действителното разпределение на вдовиците по възраст в популацията. Оценка на ефективността на група за социална подкрепа за вдовици всички възрастище съответства на средно претеглена стойност за две възрастови групи (с тегла, съответстващи на броя наблюдения в групата).

Планирани сравнения

Имайте предвид, че сумата от въведените коефициенти на контраст не е непременно равна на 0 (нула). Вместо това програмата автоматично ще направи корекции, за да гарантира, че съответните хипотези не са объркани с общата средна стойност.

За да илюстрираме това, нека се върнем към простия план 2 x 2, обсъден по-рано. Спомнете си, че броят на наблюденията в клетките на този небалансиран дизайн е -1, 2, 3 и 1. Да предположим, че искаме да сравним претеглените пределни средни стойности за фактор A (претеглени от честотата на нивата на фактор B). Можете да въведете контрастни коефициенти:

Обърнете внимание, че сборът на тези коефициенти не е 0. Програмата ще настрои коефициентите така, че сборът да е 0, като относителните им стойности ще бъдат запазени, т.е.:

1/3 2/3 -3/4 -1/4

Тези контрасти ще сравнят претеглените средни стойности за фактор А.

Хипотези за главната средна.Хипотезата, че непретеглената основна средна стойност е 0, може да бъде изследвана с помощта на коефициентите:

Хипотезата, че претеглената основна средна стойност е 0, се тества с помощта на:

В никакъв случай програмата не коригира съотношенията на контраста.

Анализ на планове с липсващи клетки (непълни планове)

Факториалните дизайни, които съдържат празни клетки (обработващи комбинации от клетки, които нямат наблюдения), се наричат ​​непълни. В такива проекти някои фактори обикновено не са ортогонални и някои взаимодействия не могат да бъдат изчислени. По принцип няма по-добър метод за анализ на такива планове.

Регресионен подход

В някои по-стари програми, които разчитат на анализиране на ANOVA дизайни с помощта на многовариантна регресия, факторите в непълните дизайни са посочени по подразбиране, както обикновено (сякаш дизайнът е пълен). След това се извършват многовариантни регресионни анализи върху тези фиктивно кодирани фактори. За съжаление, този метод дава резултати, които са много трудни, ако не и невъзможни, за интерпретиране, тъй като не е ясно как всеки ефект допринася за линейната комбинация от средства. Помислете за следния прост пример.

Фактор А Фактор Б
B1 B2
A1 3 4, 5
A2 6, 6, 7 Пропуснато

Ако извършим многовариантна регресия на формата Зависима променлива = константа + фактор A + фактор B, тогава хипотезата за значимостта на факторите A и B по отношение на линейни комбинации от средни изглежда така:

Фактор A: клетка A1,B1 = клетка A2,B1

Фактор B: клетка A1,B1 = клетка A1,B2

Този случай е прост. При по-сложни дизайни е невъзможно действително да се определи какво точно ще се изследва.

Клетъчни средства, ANOVA подход , Хипотези тип IV

Подходът, който се препоръчва в литературата и който изглежда за предпочитане, е да се изучава смислено (по отношение на изследователски въпроси) априорихипотези за средствата, наблюдавани в клетките на плана. Подробно обсъждане на този подход може да се намери в Dodge (1985), Heiberger (1989), Milliken and Johnson (1984), Searle (1987) или Woodward, Bonett и Brecht (1990). Сумите на квадратите, свързани с хипотези за линейната комбинация от средни стойности в непълни дизайни, които изследват оценките на част от ефектите, също се наричат ​​суми на квадрати IV.

Автоматично генериране на типови хипотезиIV. Когато многовариантните дизайни имат сложни модели на липсващи клетки, желателно е да се дефинират ортогонални (независими) хипотези, чието изследване е еквивалентно на изследване на основните ефекти или взаимодействия. Разработени са алгоритмични (изчислителни) стратегии (базирани на матрицата на псевдо-обратния дизайн) за генериране на подходящи тегла за такива сравнения. За съжаление окончателните хипотези не са дефинирани по уникален начин. Разбира се, те зависят от реда, в който са идентифицирани ефектите, и рядко позволяват проста интерпретация. Поради това се препоръчва внимателно да се проучи естеството на липсващите клетки, след което да се формулират хипотези ТипIV, които най-смислено отговарят на целите на изследването. След това проучете тези хипотези, като използвате опцията Планирани сравненияв прозореца резултати. Най-лесният начин за уточняване на сравненията в този случай е да се изисква въвеждането на вектор от контрасти за всички фактори заеднов прозореца Планирани сравнения.След извикване на диалоговия прозорец Планирани сравненияВсички групи в текущия план ще бъдат показани, а липсващите ще бъдат маркирани.

Липсващи клетки и тестване за специфичен ефект

Има няколко вида дизайни, в които местоположението на липсващите клетки не е произволно, а е внимателно планирано, което позволява прост анализ на основните ефекти, без да се засягат други ефекти. Например, когато необходимият брой клетки в плана не е наличен, често се използват планове латински квадратчетаза оценка на основните ефекти на няколко фактора с голям брой нива. Например факторен дизайн 4 x 4 x 4 x 4 изисква 256 клетки. В същото време можете да използвате Гръко-латински площадза оценка на основните ефекти само с 16 клетки в дизайна (гл Планиране на експеримента, том IV, съдържа подробно описание на такива планове). Непълните дизайни, при които основните ефекти (и някои взаимодействия) могат да бъдат оценени с помощта на прости линейни комбинации от средства, се наричат балансирани непълни планове.

При балансирани проекти стандартният (по подразбиране) метод за генериране на контрасти (тегла) за основните ефекти и взаимодействия след това ще създаде таблица с анализ на отклоненията, в която сумите на квадратите за съответните ефекти не се смесват една с друга. опция Специфични ефектипрозорец резултатище генерира липсващи контрасти, като напише нула в липсващите клетки на плана. Веднага след като опцията е заявена Специфични ефектиза потребителя, който изследва някаква хипотеза, се появява таблица с резултати с действителните тегла. Имайте предвид, че при балансиран дизайн сумите на квадратите на съответните ефекти се изчисляват само ако тези ефекти са ортогонални (независими) спрямо всички други основни ефекти и взаимодействия. В противен случай трябва да използвате опцията Планирани сравненияза изследване на смислени сравнения между средствата.

Липсващи клетки и обединени ефекти/термини за грешка

Ако опция Регресионен подходв панела за стартиране на модула Дисперсионен анализне е избрано, средният модел на клетките ще се използва при изчисляване на сумата от квадрати за ефекти (настройката по подразбиране). Ако дизайнът не е балансиран, тогава при комбиниране на неортогонални ефекти (вижте по-горе обсъждането на опцията Пропуснати клетки и специфичен ефект) може да се получи сума от квадрати, състояща се от неортогонални (или припокриващи се) компоненти. Получените резултати обикновено не могат да се интерпретират. Следователно, човек трябва да бъде много внимателен при избора и внедряването на сложни непълни експериментални проекти.

Има много книги с подробни обсъждания на различни видове планове. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken and Johnson, 1984; Searle, 1987; Woodward and Bonett, 1990), но този тип информация е извън обхвата на този учебник. По-късно в този раздел обаче ще бъде демонстриран анализ на различни типове планове.

Предположения и ефектите от нарушаване на предположенията

Отклонение от предположението за нормални разпределения

Да предположим, че зависимата променлива се измерва в цифрова скала. Нека приемем също, че зависимата променлива е нормално разпределена във всяка група. Дисперсионен анализсъдържа широк набор от графики и статистики в подкрепа на това предположение.

Ефекти от прекъсване.Изобщо Етестът е много устойчив на отклонения от нормалното (за подробни резултати вижте Lindman, 1974). Ако ексцесът е по-голям от 0, тогава стойността на статистиката е Еможе да стане много малък. Нулевата хипотеза се приема, въпреки че може да не е вярна. Ситуацията е обратна, когато ексцесът е по-малък от 0. Изкривеността на разпределението обикновено има малък ефект върху Естатистика. Ако броят на наблюденията в клетка е достатъчно голям, тогава отклонението от нормалното не е особено значимо поради централна гранична теорема, според които разпределението на средната стойност е близко до нормалното, независимо от първоначалното разпределение. Подробно обсъждане на устойчивостта Естатистическите данни могат да бъдат намерени в Box and Anderson (1955) или Lindman (1974).

Еднородност на дисперсията

Предположения.Предполага се, че вариациите на различните дизайнерски групи са еднакви. Това предположение се нарича предположение хомогенност на дисперсията.Спомнете си, че в началото на този раздел, когато описваме изчисляването на сумата от квадратни грешки, ние извършихме сумирането във всяка група. Ако дисперсиите в две групи са различни една от друга, тогава сумирането им не е много естествено и не дава оценка на общата дисперсия в рамките на групата (тъй като в този случай изобщо няма обща дисперсия). Модул Анализ на дисперсията -ANOVA/МАНОВАсъдържа голям набор от статистически критерии за откриване на отклонения от допусканията за хомогенност на дисперсията.

Ефекти от прекъсване.Линдман (1974, стр. 33) показва това Екритерият е доста стабилен по отношение на нарушаване на допусканията за хомогенност на дисперсията ( хетерогенноствариация, виж също Box, 1954a, 1954b; Hsu, 1938).

Специален случай: корелация на средни стойности и дисперсии.Има моменти, когато Естатистика може заблуждавам.Това се случва, когато средните стойности на проектните клетки са свързани с дисперсията. Модул Дисперсионен анализви позволява да начертаете диаграми на разсейване на дисперсия или стандартно отклонение спрямо средната стойност, за да откриете такава корелация. Причината, поради която тази корелация е опасна, е следната. Нека си представим, че в плана има 8 клетки, 7 от които имат почти еднаква средна стойност, а в една клетка средната е много по-висока от останалите. Тогава Етестът може да открие статистически значим ефект. Но да предположим, че в клетка с голяма средна стойност дисперсията е значително по-голяма от останалите, т.е. средната стойност и дисперсията в клетките са зависими (колкото по-висока е средната стойност, толкова по-голяма е дисперсията). В този случай голямата средна стойност е ненадеждна, защото може да е причинена от голямо отклонение в данните. въпреки това Естатистика въз основа на обединенидисперсията в клетките ще обхване голямата средна стойност, въпреки че тестовете, базирани на дисперсията във всяка клетка, няма да считат всички разлики в средните стойности за значими.

Този тип данни (голяма средна стойност и голяма дисперсия) често се появяват, когато има извънредни наблюдения. Едно или две извънредни наблюдения значително изместват средната стойност и значително увеличават дисперсията.

Хомогенност на дисперсията и ковариацията

Предположения.Многовариантните дизайни с многовариантни зависими мерки също прилагат предположението за хомогенност на дисперсията, описано по-рано. Въпреки това, тъй като има многовариантни зависими променливи, също така се изисква техните кръстосани корелации (ковариации) да бъдат еднакви във всички клетки на дизайна. Модул Дисперсионен анализпредлага различни начини за тестване на тези предположения.

Ефекти от прекъсване. Многоизмерен аналог Е- критерий - λ-тест на Wilks. Не се знае много за устойчивостта на теста на Wilks λ по отношение на нарушенията на горните предположения. Въпреки това, тъй като интерпретацията на резултатите от модула Дисперсионен анализобикновено се основава на значимостта на едномерните ефекти (след установяване на значимостта на общия критерий), обсъждането на устойчивостта засяга главно едномерния анализ на дисперсията. Следователно значението на едномерните ефекти трябва да бъде внимателно изследвано.

Специален случай: анализ на ковариацията.Особено сериозни нарушения на хомогенността на дисперсията/ковариацията могат да възникнат, когато в дизайна са включени ковариати. По-специално, ако корелацията между ковариатите и зависимите мерки варира в различните клетки в дизайна, може да последва погрешно тълкуване на резултатите. Не забравяйте, че анализът на ковариацията по същество извършва регресионен анализ във всяка клетка, за да изолира тази част от дисперсията, която се отчита от ковариата. Предположението за хомогенност на дисперсия/ковариация предполага, че този регресионен анализ се провежда при следното ограничение: всички регресионни уравнения (наклони) за всички клетки са еднакви. Ако това не се приеме, може да се появят големи грешки. Модул Дисперсионен анализима няколко специални критерия за тестване на това предположение. Препоръчително е да използвате тези критерии, за да сте сигурни, че регресионните уравнения за различните клетки са приблизително еднакви.

Сферичност и сложна симетрия: причини за използване на многовариантен подход към повтарящи се измервания в анализа на дисперсията

При дизайни, съдържащи фактори на повтарящи се измервания с повече от две нива, използването на едномерен ANOVA изисква допълнителни допускания: предположението за сложна симетрия и допускането за сферичност. Тези предположения рядко се изпълняват (вижте по-долу). Ето защо през последните години многовариантният анализ на дисперсията придоби популярност в такива дизайни (и двата подхода са комбинирани в модула Дисперсионен анализ).

Допускане на сложна симетрияПредположението за съставна симетрия е, че дисперсиите (споделени в групи) и ковариациите (споделени в групи) за различни повтарящи се мерки са хомогенни (едни и същи). Това е достатъчно условие, за да бъде валиден едномерният F тест за повтарящи се измервания (т.е. докладваните F стойности са средно в съответствие с F разпределението). В този случай обаче това условие не е необходимо.

Допускане на сферичност.Предположението за сферичност е необходимо и достатъчно условие F-тестът да бъде валиден. Състои се в това, че в групите всички наблюдения са независими и равномерно разпределени. Естеството на тези предположения и въздействието от тяхното нарушаване обикновено не са добре описани в книгите за ANOVA - те ще бъдат разгледани в следващите параграфи. Ще бъде показано също, че резултатите от едновариантния подход могат да се различават от резултатите от многовариантния подход и ще бъде обяснено какво означава това.

Необходимостта от независимост на хипотезите.Общият начин за анализ на данни в ANOVA е монтаж на модела. Ако по отношение на модела, който отговаря на данните, има такива априорихипотези, тогава дисперсията се разделя, за да се тестват тези хипотези (критерии за основни ефекти, взаимодействия). От изчислителна гледна точка, този подход генерира набор от контрасти (набор от сравнения на планови средни стойности). Ако обаче контрастите не са независими един от друг, разделянето на вариациите става безсмислено. Например, ако два контраста АИ бса идентични и съответната част от дисперсията се извлича, след което същата част се извлича два пъти. Например, глупаво и безсмислено е да се идентифицират две хипотези: „средната стойност в клетка 1 е по-висока от средната стойност в клетка 2“ и „средната стойност в клетка 1 е по-висока от средната стойност в клетка 2“. Така че хипотезите трябва да са независими или ортогонални.

Независими хипотези при повтарящи се измервания.Общ алгоритъм, реализиран в модула Дисперсионен анализ, ще се опита да генерира независими (ортогонални) контрасти за всеки ефект. За фактора на повтарящите се измервания тези контрасти предоставят много хипотези относно различиямежду нивата на разглеждания фактор. Въпреки това, ако тези различия са свързани в рамките на групите, тогава получените контрасти вече не са независими. Например, при преподаване, при което студентите се измерват три пъти в един семестър, може да се случи промяната между 1-во и 2-ро измерване да има отрицателна корелация с промяната между 2-ро и 3-то измерване на предметите. Тези, които са усвоили по-голямата част от материала между 1-во и 2-ро измерение, усвояват по-малка част през времето, изминало между 2-ро и 3-то измерение. Всъщност, за повечето случаи, когато ANOVA се използва за повтарящи се измервания, може да се приеме, че промените между нивата са корелирани между субектите. Когато обаче това се случи, предположението за сложна симетрия и предположението за сферичност не са валидни и независимите контрасти не могат да бъдат изчислени.

Въздействието на нарушенията и начините за коригирането им.Когато сложните предположения за симетрия или сферичност не са изпълнени, ANOVA може да доведе до грешни резултати. Преди многовариантните процедури да бъдат достатъчно разработени, бяха предложени няколко допускания за компенсиране на нарушенията на тези допускания. (Вижте например Greenhouse & Geisser, 1959 и Huynh & Feldt, 1970). Тези методи все още се използват широко (затова са представени в модула Дисперсионен анализ).

Подход за многовариантен анализ на дисперсията към повтарящи се измервания.Като цяло, проблемите на сложната симетрия и сферичност се отнасят до факта, че наборите от контрасти, включени в изследването на ефектите от фактори на повтарящи се измервания (с повече от 2 нива), не са независими един от друг. Не е необходимо обаче да са независими, ако се използват многоизмерентест за едновременно тестване на статистическата значимост на две или повече повтарящи се измервания факторни контрасти. Това е причината многовариантният анализ на дисперсионните техники да се използва все по-често за тестване на значимостта на едномерни многократни измервания на фактори с повече от 2 нива. Този подход е широко приет, тъй като обикновено не изисква сложна симетрия или сферичност.

Случаи, в които не може да се използва подходът на многовариантния анализ на дисперсията.Има примери (проекти), при които подходът на многовариантния анализ на дисперсията не може да бъде приложен. Това обикновено са случаи, при които има малък брой субекти в дизайна и много нива във фактора за повтарящи се измервания. Тогава може да има твърде малко наблюдения за извършване на многовариантен анализ. Например, ако има 12 предмета, стр = 4 фактор на повтарящи се измервания и всеки фактор има к = 3 нива. Тогава взаимодействието на 4 фактора ще "консумира" (к-1)стр = 2 4 = 16 степени на свобода. Има обаче само 12 субекта, така че в този пример не може да се извърши многовариантен тест. Модул Дисперсионен анализнезависимо ще открие тези наблюдения и ще изчисли само едномерни критерии.

Разлики в едновариантните и многовариантните резултати.Ако едно изследване включва голям брой повтарящи се измервания, може да има случаи, при които подходът ANOVA с едномерни повтарящи се измервания дава резултати, които са много различни от тези, получени с многовариантния подход. Това означава, че разликите между нивата на съответните повтарящи се измервания са корелирани между субектите. Понякога този факт е от някакъв независим интерес.

Многовариантен дисперсионен анализ и моделиране на структурни уравнения

През последните години моделирането на структурни уравнения стана популярно като алтернатива на многовариантния анализ на дисперсията (виж, например, Bagozzi и Yi, 1989; Bagozzi, Yi и Singh, 1991; Cole, Maxwell, Arvey и Salas, 1993) . Този подход позволява тестване на хипотези не само за средни стойности в различни групи, но и за корелационни матрици на зависими променливи. Например, може да се смекчат предположенията за хомогенност на вариациите и ковариациите и изрично да се включат вариациите на грешката и ковариациите в модела за всяка група. Модул STATISTICAМоделиране на структурни уравнения (SEPATH) (виж том III) дава възможност за такъв анализ.

Използването на статистика в тази бележка ще бъде илюстрирано с междусекторен пример. Да приемем, че сте производствен мениджър в Perfect Parachute. Парашутите са изработени от синтетични влакна, доставени от четири различни доставчика. Една от основните характеристики на парашута е неговата здравина. Трябва да се уверите, че всички доставени влакна са с еднаква здравина. За да се отговори на този въпрос, трябва да се създаде експериментален дизайн за измерване на здравината на парашутите, изтъкани от синтетични влакна от различни доставчици. Информацията, получена от този експеримент, ще определи кой доставчик предоставя най-издръжливите парашути.

Много приложения включват експерименти, които разглеждат множество групи или нива на един фактор. Някои фактори, като например температурата на изпичане на керамика, може да имат множество числени нива (т.е. 300°, 350°, 400° и 450°). Други фактори, като местоположението на артикулите в супермаркет, могат да имат категорични нива (напр. първи доставчик, втори доставчик, трети доставчик, четвърти доставчик). Еднофакторни експерименти, при които експерименталните единици са разпределени на случаен принцип към групи или факторни нива, се наричат ​​напълно рандомизирани.

ИзползванеЕ-критерии за оценка на различията между няколко математически очаквания

Ако числените измервания на фактора в групите са непрекъснати и са изпълнени някои допълнителни условия, дисперсионният анализ (ANOVA) се използва за сравняване на математическите очаквания на няколко групи. Ананализ о f Vaрианс). Анализът на дисперсията с помощта на напълно рандомизирани дизайни се нарича еднопосочна ANOVA процедура. В някои отношения терминът анализ на дисперсията е погрешно наименование, тъй като сравнява разликите между очакваните стойности на групите, а не между дисперсиите. Сравнението на математическите очаквания обаче се извършва точно на базата на анализ на вариациите на данните. В процедурата ANOVA общата вариация в резултатите от измерването се разделя на междугрупови и вътрегрупови (фиг. 1). Вариациите в рамките на групата се обясняват с експериментална грешка, а вариациите между групите се обясняват с ефектите на експерименталните условия. Символ собозначава броя на групите.

Ориз. 1. Вариация на разделяне в напълно рандомизиран експеримент

Изтеглете бележката в или формат, примери във формат

Нека се преструваме, че сгрупите се извличат от независими популации, които имат нормално разпределение и еднаква вариация. Нулевата хипотеза е, че математическите очаквания на популациите са еднакви: H 0: μ 1 = μ 2 = ... = μ s. Алтернативната хипотеза гласи, че не всички математически очаквания са еднакви: H 1: не всички μ j са еднакви й= 1, 2, …, s).

На фиг. Фигура 2 представя истинската нулева хипотеза за математическите очаквания на петте сравнявани групи, при условие че популациите имат нормално разпределение и една и съща вариация. Петте популации, свързани с различни нива на фактора, са идентични. Следователно те се наслагват един върху друг, като имат едно и също математическо очакване, вариация и форма.

Ориз. 2. Пет генерални съвкупности имат едно и също математическо очакване: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

От друга страна, да предположим, че всъщност нулевата хипотеза е невярна, като четвъртото ниво има най-високата очаквана стойност, първото ниво има малко по-ниска очаквана стойност, а останалите нива имат същите и дори по-ниски очаквани стойности ( Фигура 3). Имайте предвид, че с изключение на очакваните стойности, всичките пет популации са идентични (т.е. имат една и съща променливост и форма).

Ориз. 3. Ефектът от експерименталните условия се наблюдава: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

Когато се тества хипотезата за равенството на математическите очаквания на няколко генерални съвкупности, общата вариация се разделя на две части: междугрупова вариация, дължаща се на разликите между групите, и вътрешногрупова вариация, дължаща се на разликите между елементи, принадлежащи към една и съща група. Общата вариация се изразява чрез общата сума на квадратите (SST – sum of squares total). Тъй като нулевата хипотеза е, че математическите очаквания на всички сгрупите са равни помежду си, общата вариация е равна на сумата от квадратите на разликите между отделните наблюдения и общата средна стойност (средна средна), изчислена за всички проби. Пълна вариация:

Където - обща авария, X ij - аз-e наблюдение в й- група или ниво, n j- брой наблюдения в йта група, н- общият брой наблюдения във всички групи (т.е. н = н 1 + n 2 + … + n c), с- брой изучавани групи или нива.

Вариация между групите, обикновено наричана междугрупова сума от квадрати (SSA – сума от квадрати между групи), е равна на сумата от квадратите на разликите между средната стойност на извадката от всяка група йи общо средно , умножено по обема на съответната група n j:

Където с- брой изучавани групи или нива, n j- брой наблюдения в йта група, й- средна стойност йта група, - обща средна стойност.

Вариация в рамките на групата, обикновено наричана вътрешногрупова сума от квадрати (SSW – sum of squares withing groups), е равна на сумата от квадратите на разликите между елементите на всяка група и средната стойност на извадката от тази група й:

Където хij - азти елемент йта група, й- средна стойност йта група.

Тъй като се сравняват сфакторни нива, междугруповата сума на квадратите има s – 1степени на свобода. Всеки от снива има n j – 1 степени на свобода, така че вътрешногруповият сбор от квадрати има н- Сстепени на свобода и

В допълнение, общата сума на квадратите има н – 1 степени на свобода, тъй като всяко наблюдение хijсе сравнява с общата средна стойност, изчислена за всички ннаблюдения. Ако всяка от тези суми се раздели на съответния брой степени на свобода, възникват три вида дисперсия: интергрупа(среден квадрат сред - MSA), вътрешногрупови(среден квадрат в рамките на - MSW) и пълен(общ среден квадрат - MST):

Въпреки факта, че основната цел на дисперсионния анализ е да се сравнят математическите очаквания сгрупи, за да се идентифицира ефектът от експерименталните условия, името му се дължи на факта, че основният инструмент е анализът на дисперсии от различни видове. Ако нулевата хипотеза е вярна, и между математическите очаквания сгрупи няма значителни разлики, и трите дисперсии - MSA, MSW и MST - са оценки на дисперсията σ 2присъщи на анализираните данни. По този начин, за да тестваме нулевата хипотеза H 0: μ 1 = μ 2 = ... = μ sи алтернативна хипотеза H 1: не всички μ j са еднакви й = 1, 2, …, с), е необходимо да се изчисли статистика Е-критерий, който е отношението на две дисперсии, MSA и MSW. Тест Е-статистика при еднопосочен дисперсионен анализ

Статистика Е- подчинени на критерии Е-разпределение с s – 1степени на свобода в числителя M.S.A.И n – sстепени на свобода в знаменателя М.С.В.. За дадено ниво на значимост α, нулевата хипотеза се отхвърля, ако изчисленото Е ЕU, присъщо Е-разпределение с s – 1 n – sстепени на свобода в знаменателя. Така, както е показано на фиг. 4 решаващото правило е формулирано по следния начин: нулева хипотеза H 0отхвърлен ако F>FU; иначе не се отхвърля.

Ориз. 4. Критична област на дисперсионен анализ при тестване на хипотеза H 0

Ако нулевата хипотеза H 0е вярно, изчислено Е-статистиката е близка до 1, тъй като нейният числител и знаменател са оценки на една и съща величина - дисперсията σ 2, присъща на анализираните данни. Ако нулевата хипотеза H 0е невярно (и има значителна разлика между математическите очаквания на различните групи), изчислено Е- статистиката ще бъде много по-голяма от единица, тъй като нейният числител, MSA, оценява, в допълнение към естествената променливост на данните, ефекта от експерименталните условия или разликата между групите, докато знаменателят MSW оценява само естествената променливост на данните . По този начин процедурата ANOVA е Е-критерий, при който при дадено ниво на значимост α нулевата хипотеза се отхвърля, ако изчисленото Е-статистиките са по-големи от горната критична стойност ЕU, присъщо Е-разпределение с s – 1степени на свобода в числителя и n – sстепени на свобода в знаменателя, както е показано на фиг. 4.

За да илюстрираме еднопосочния анализ на дисперсията, нека се върнем към сценария, очертан в началото на бележката. Целта на експеримента е да се установи дали парашутите, изтъкани от синтетични влакна, получени от различни доставчици, имат еднаква здравина. Всяка група има пет парашута. Групите са разделени по доставчик - Доставчик 1, Доставчик 2, Доставчик 3 и Доставчик 4. Измерването на здравината на парашутите се извършва със специален уред, който тества тъканта за разкъсване от двете страни. Силата, необходима за счупване на парашут, се измерва на специална скала. Колкото по-висока е силата на скъсване, толкова по-здрав е парашутът. Excel ви позволява да анализирате Е- статистика с едно кликване. Преминете през менюто ДанниАнализ на даннии изберете линията Еднопосочна ANOVA, попълнете прозореца, който се отваря (фиг. 5). Експерименталните резултати (якост на скъсване), някои описателни статистики и резултатите от еднопосочен анализ на дисперсията са представени на фиг. 6.

Ориз. 5. Прозорец Еднопосочен анализ на пакета за анализ на отклоненията Excel

Ориз. 6. Индикатори за якост на парашути, изтъкани от синтетични влакна, получени от различни доставчици, описателна статистика и резултати от еднопосочен анализ на дисперсията

Анализът на фигура 6 показва, че има известна разлика между средните стойности на извадката. Средната якост на влакната, получени от първия доставчик е 19,52, от втория - 24,26, от третия - 22,84 и от четвъртия - 21,16. Статистически значима ли е тази разлика? Разпределението на силата на разкъсване е показано в диаграмата на разсейване (фиг. 7). То ясно показва различията както между, така и вътре в групите. Ако всяка група беше по-голяма по размер, за анализирането им можеше да се използва диаграма на стъбла и листа, графика в кутия или диаграма на звънец.

Ориз. 7. Диаграма на разпределението на якостта за парашути, изтъкани от синтетични влакна, получени от четирима доставчици.

Нулевата хипотеза гласи, че няма значителни разлики между средните резултати за сила: H 0: μ 1 = μ 2 = μ 3 = μ 4. Алтернативна хипотеза е, че има поне един доставчик, чиято средна здравина на влакната се различава от останалите: H 1: не всички μ j са еднакви ( й = 1, 2, …, с).

Обща средна стойност (вижте фиг. 6) = AVERAGE(D12:D15) = 21,945; за да определите, можете също да усредните всички 20 оригинални числа: = СРЕДНО(A3:D7). Изчисляват се стойностите на дисперсията Пакет за анализи се отразяват в табелата Дисперсионен анализ(вижте фиг. 6): SSA = 63.286, SSW = 97.504, SST = 160.790 (вижте колоната ССмаси Дисперсионен анализФигура 6). Средните стойности се изчисляват чрез разделяне на тези суми от квадрати на съответния брой степени на свобода. Тъй като с= 4, а н= 20, получаваме следните стойности на степените на свобода; за SSA: s – 1= 3; за SSW: n–c= 16; за SST: n – 1= 19 (вижте колоната df). Така: MSA = SSA / ( s – 1)= 21.095; MSW = SSW / ( n–c) = 6,094; MST = SST / ( n – 1) = 8,463 (вижте колоната Г-ЦА). Е-статистика = MSA / MSW = 3,462 (вижте колоната Е).

Горна критична стойност ЕU, характерни за Е-разпределение, определено по формулата =F.OBR(0,95;3;16) = 3,239. Параметри на функцията =F.OBR(): α = 0,05, числителят има три степени на свобода, а знаменателят има 16. Така изчислената Е-статистиката, равна на 3,462, надвишава горната критична стойност ЕU= 3.239, нулевата хипотеза се отхвърля (фиг. 8).

Ориз. 8. Критична област на дисперсионен анализ при ниво на значимост 0,05, ако числителят има три степени на свобода, а знаменателят е -16

Р-стойност, т.е. вероятността, че ако нулевата хипотеза е вярна Е-статистика не по-малка от 3,46, равна на 0,041 или 4,1% (вижте колоната p-стойностмаси Дисперсионен анализФигура 6). Тъй като тази стойност не надвишава нивото на значимост α = 5%, нулевата хипотеза се отхвърля. Освен това, Р-стойност показва, че вероятността за откриване на такава или по-голяма разлика между математическите очаквания на генералните съвкупности, при условие че те всъщност са еднакви, е равна на 4,1%.

Така. Има разлика между четирите примерни средни стойности. Нулевата хипотеза беше, че всички математически очаквания на четирите популации са равни. При тези условия се изчислява мярка за общата променливост (т.е. общата вариация на SST) на силата на всички парашути чрез сумиране на квадратите на разликите между всяко наблюдение X ijи общо средно . След това общата вариация беше разделена на два компонента (виж Фиг. 1). Първият компонент беше междугруповата вариация в SSA, а втората беше вътрешногруповата вариация в SSW.

Какво обяснява променливостта в данните? С други думи, защо всички наблюдения не са еднакви? Една от причините е, че различните компании доставят влакна с различна здравина. Това отчасти обяснява защо групите имат различни математически очаквания: колкото по-силен е ефектът от експерименталните условия, толкова по-голяма е разликата между математическите очаквания на групите. Друга причина за променливостта на данните е естествената променливост на всеки процес, в случая производството на парашути. Дори ако всички влакна бяха закупени от един и същи доставчик, здравината им нямаше да бъде еднаква при равни други условия. Тъй като този ефект възниква във всяка група, той се нарича вариация в рамките на групата.

Разликите между средните стойности на извадката се наричат ​​междугрупова вариация SSA. Част от вътрешногруповата вариация, както вече беше посочено, се обяснява с принадлежността на данните към различни групи. Въпреки това, дори ако групите бяха напълно еднакви (т.е. нулевата хипотеза беше вярна), вариация между групите пак щеше да съществува. Причината за това е естествената променливост на процеса на производство на парашут. Тъй като пробите са различни, техните средни стойности на извадката се различават една от друга. Следователно, ако нулевата хипотеза е вярна, променливостта между и в рамките на групата представлява оценка на променливостта на популацията. Ако нулевата хипотеза е невярна, хипотезата между групите ще бъде по-голяма. Именно този факт е в основата Е-критерии за сравняване на различията между математическите очаквания на няколко групи.

След извършване на еднопосочен ANOVA и установяване на значителна разлика между фирмите, остава неизвестно кой доставчик е значително различен от останалите. Знаем само, че математическите очаквания на генералните съвкупности не са еднакви. С други думи, поне едно от математическите очаквания е значително различно от останалите. За да определите кой доставчик е различен от останалите, можете да използвате Процедура Тъки, използвайки сравнения по двойки между доставчици. Тази процедура е разработена от John Tukey. Впоследствие той и К. Крамер независимо модифицират тази процедура за ситуации, в които размерите на извадките се различават един от друг.

Множествено сравнение: процедура Тъки-Крамер

В нашия сценарий беше използван еднопосочен анализ на дисперсията за сравняване на силата на парашутите. След като са открити значителни разлики между математическите очаквания на четирите групи, е необходимо да се определи кои групи се различават една от друга. Въпреки че има няколко начина за решаване на този проблем, ние ще опишем само процедурата за множествено сравнение на Tukey-Kramer. Този метод е пример за процедури за post hoc сравнение, тъй като хипотезата, която се тества, се формулира след анализ на данните. Процедурата на Tukey-Kramer позволява всички двойки групи да бъдат сравнени едновременно. На първия етап се изчисляват разликите хй й, Където j ≠й, между математическите очаквания s(s – 1)/2групи. Критичен обхватПроцедурата на Tukey-Kramer се изчислява по формулата:

Където Q U- горната критична стойност на студентизираното разпределение на диапазона, която има сстепени на свобода в числителя и н - Сстепени на свобода в знаменателя.

Ако размерите на извадката не са еднакви, критичният диапазон се изчислява за всяка двойка математически очаквания поотделно. На последния етап всеки от s(s – 1)/2двойки математически очаквания се сравняват със съответния критичен диапазон. Елементите на една двойка се считат за значително различни, ако модулът на разликата | X j й| между тях надхвърля критичния диапазон.

Нека приложим процедурата на Тъки-Крамер към проблема за здравината на парашутите. Тъй като парашутната компания има четирима доставчици, има 4(4 – 1)/2 = 6 двойки доставчици за проверка (Фигура 9).

Ориз. 9. Сравнения по двойки на извадкови средни стойности

Тъй като всички групи имат еднакъв обем (т.е. всички n j = n j), достатъчно е да се изчисли само един критичен диапазон. За да направите това, според таблицата ANOVA(фиг. 6) определяме стойността MSW = 6,094. След това намираме стойността Q Uпри α = 0,05, с= 4 (брой степени на свобода в числителя) и н- С= 20 – 4 = 16 (броят на степените на свобода в знаменателя). За съжаление не намерих съответната функция в Excel, затова използвах таблицата (фиг. 10).

Ориз. 10. Критична стойност на студентизирания диапазон Q U

Получаваме:

Тъй като само 4,74 > 4,47 (вижте долната таблица на фиг. 9), съществува статистически значима разлика между първия и втория доставчик. Всички останали двойки имат примерни средства, които не ни позволяват да говорим за техните различия. Следователно средната якост на парашутите, изтъкани от влакна, закупени от първия доставчик, е значително по-малка от тази на втория.

Необходими условия за еднопосочен дисперсионен анализ

При решаването на проблема със здравината на парашутите не проверихме дали условията, при които е възможно да се използва еднофакторен Е-критерий. Как да разберете дали можете да използвате един фактор Е-критерий при анализиране на конкретни експериментални данни? Единичен фактор Е-критерият може да се приложи само ако са изпълнени три основни допускания: експерименталните данни трябва да са случайни и независими, да имат нормално разпределение и дисперсиите им да са равни.

Първо предположение - произволност и независимост на данните- винаги трябва да се извършва, тъй като коректността на всеки експеримент зависи от случайността на избора и/или процеса на рандомизация. За да се избегнат отклонения в резултатите, е необходимо данните да бъдат извлечени от сгенерални съвкупности на случаен принцип и независимо една от друга. По същия начин данните трябва да бъдат разпределени на случаен принцип снива на фактора, който ни интересува (експериментални групи). Нарушаването на тези условия може сериозно да изкриви резултатите от дисперсионния анализ.

Второ предположение - нормалност- означава, че данните са извлечени от нормално разпределени популации. Що се отнася до T-критерии, еднопосочен дисперсионен анализ въз основа на Е-критерият е относително малко чувствителен към нарушаване на това условие. Ако разпределението не се отклонява твърде значително от нормалното, нивото на значимост Е-критерият се променя малко, особено ако размерът на извадката е достатъчно голям. Ако условието за нормалност на разпределението е сериозно нарушено, трябва да се приложи.

Трето предположение - хомогенност на дисперсията- означава, че дисперсиите на всяка популация са равни една на друга (т.е. σ 1 2 = σ 2 2 = ... = σ j 2). Това предположение позволява да се реши дали да се отделят или да се обединят вариациите в рамките на групата. Ако размерите на групите са еднакви, условието за хомогенност на дисперсията има малък ефект върху заключенията, получени с помощта на Е- критерии. Въпреки това, ако размерите на извадката са неравни, нарушаването на условието за равенство на дисперсиите може сериозно да изкриви резултатите от анализа на дисперсията. Следователно трябва да се положат усилия, за да се гарантира, че размерите на извадката са еднакви. Един от методите за проверка на предположението за хомогенност на дисперсията е критерият Левенописани по-долу.

Ако от всичките три условия е нарушено само условието за хомогенност на дисперсията, процедура, подобна на T-критерий, използващ отделна вариация (за повече подробности вижте). Въпреки това, ако предположенията за нормално разпределение и хомогенност на дисперсията са нарушени едновременно, е необходимо да се нормализират данните и да се намалят разликите между дисперсиите или да се приложи непараметрична процедура.

Тест на Левен за тестване на хомогенността на дисперсията

Макар че Е- критерият е относително устойчив на нарушения на условието за равенство на дисперсиите в групи; грубото нарушение на това предположение значително влияе върху нивото на значимост и мощност на критерия. Може би един от най-мощните е критерият Левен. За проверка на равенството на дисперсиите собщи популации, ще тестваме следните хипотези:

Н 0: σ 1 2 = σ 2 2 = … = σй 2

H 1: Не всички σ j 2са същите ( й = 1, 2, …, с)

Модифицираният тест на Levene се основава на твърдението, че ако променливостта в групите е еднаква, анализът на дисперсията на абсолютните стойности на разликите между наблюденията и груповите медиани може да се използва за тестване на нулевата хипотеза за равенство на дисперсиите. Така че първо трябва да изчислите абсолютните стойности на разликите между наблюденията и медианите във всяка група и след това да извършите еднопосочен анализ на дисперсията на получените абсолютни стойности на разликите. За да илюстрираме критерия на Левен, нека се върнем към сценария, очертан в началото на бележката. Използвайки данните, представени на фиг. 6, ще проведем подобен анализ, но по отношение на модулите на разликите в изходните данни и медианите за всяка извадка поотделно (фиг. 11).

Последни материали в раздела:

Значението на азбуката в нашия живот Защо ни е необходима азбука
Значението на азбуката в нашия живот Защо ни е необходима азбука

MBOU "Краснослободско средно училище № 1" Изпълнител: Данила Шарафутдинов, ученик от 1 клас Ръководител: Елена Фомина...

Основни изследователски методи в психологията Субективните методи включват метода
Основни изследователски методи в психологията Субективните методи включват метода

За нас е важно да познаваме цял набор от специални психологически методи. Именно използването на специфични техники и спазването на специални норми и правила може...

Превземането на Кьонигсберг 1945 г. Битката при Кьонигсберг.
Превземането на Кьонигсберг 1945 г. Битката при Кьонигсберг. "за превземането на Кьонигсберг"

План на операцията Разгромът на групата Хайлсберг и намаляването на фронтовата линия позволи на съветското командване да извърши...