Analiza variance. Predmet: Analiza variance Multivariatna analiza variance

Analiza variance je niz statističnih metod, namenjenih preverjanju hipotez o razmerju med določenimi značilnostmi in proučevanimi dejavniki, ki nimajo kvantitativnega opisa, ter ugotavljanju stopnje vpliva dejavnikov in njihovega medsebojnega delovanja. V strokovni literaturi se pogosto imenuje ANOVA (iz angleškega imena Analysis of Variations). To metodo je leta 1925 prvi razvil R. Fischer.

Vrste in kriteriji analize variance

Ta metoda se uporablja za preučevanje razmerja med kvalitativnimi (nominalnimi) značilnostmi in kvantitativno (zvezno) spremenljivko. V bistvu testira hipotezo o enakosti aritmetičnih sredin več vzorcev. Tako ga lahko obravnavamo kot parametrični kriterij za primerjavo centrov več vzorcev hkrati. Če to metodo uporabimo za dva vzorca, bodo rezultati analize variance enaki rezultatom Studentovega t-testa. Vendar pa nam ta študija za razliko od drugih meril omogoča podrobnejšo proučitev problema.

Disperzijska analiza v statistiki temelji na zakonu: vsota kvadratov odklonov združenega vzorca je enaka vsoti kvadratov znotrajskupinskih odklonov in vsoti kvadratov medskupinskih odklonov. Študija uporablja Fisherjev test za ugotavljanje pomembnosti razlike med variancami med skupinami in variancami znotraj skupine. Nujna predpogoja za to pa sta normalnost porazdelitve in homoskedastičnost (enakost variance) vzorcev. Obstajata univariatna (enofaktorska) analiza variance in multivariatna (multifaktorska). Prvi upošteva odvisnost preučevane vrednosti od ene značilnosti, drugi - od mnogih hkrati, in nam tudi omogoča, da ugotovimo povezavo med njimi.

Dejavniki

Dejavniki so nadzorovane okoliščine, ki vplivajo na končni rezultat. Njegova raven ali način obdelave je vrednost, ki označuje določeno manifestacijo tega stanja. Te številke so običajno predstavljene na nominalni ali ordinalni merilni lestvici. Izhodne vrednosti se pogosto merijo na kvantitativni ali ordinalni lestvici. Nato se pojavi problem združevanja izhodnih podatkov v več opazovanj, ki ustrezajo približno enakim številčnim vrednostim. Če se šteje, da je število skupin pretirano veliko, potem število opazovanj v njih morda ne zadostuje za pridobitev zanesljivih rezultatov. Če vzamete premajhno številko, lahko to povzroči izgubo pomembnih lastnosti vpliva na sistem. Poseben način združevanja podatkov je odvisen od količine in narave variacije vrednosti. Število in velikost intervalov pri univariatni analizi najpogosteje določata načelo enakih intervalov ali načelo enakih frekvenc.

Analiza problemov variance

Torej obstajajo primeri, ko morate primerjati dva ali več vzorcev. Takrat je priporočljivo uporabiti analizo variance. Ime metode pove, da se sklepi oblikujejo na podlagi študije komponent variance. Bistvo študije je, da celotno spremembo indikatorja razdelimo na sestavne dele, ki ustrezajo delovanju vsakega posameznega dejavnika. Razmislimo o številnih problemih, ki jih rešuje tipična analiza variance.

Primer 1

Delavnica ima več avtomatskih strojev, ki izdelujejo določen del. Velikost vsakega dela je naključna spremenljivka, ki je odvisna od nastavitve vsakega stroja in naključnih odstopanj, ki se pojavijo med proizvodnim procesom delov. Na podlagi merilnih podatkov o dimenzijah delov je treba ugotoviti, ali so stroji enako konfigurirani.

Primer 2

Pri izdelavi električne naprave se uporabljajo različne vrste izolacijskega papirja: kondenzatorski, električni itd. Napravo lahko impregniramo z različnimi snovmi: epoksi smolo, lak, smolo ML-2 itd. Netesnosti lahko odpravimo v vakuumu pri povišan tlak, z ogrevanjem. Impregnacija se lahko izvede s potopitvijo v lak, pod neprekinjenim curkom laka itd. Električni aparat kot celota je napolnjen z določeno spojino, katere možnosti je več. Indikatorji kakovosti so električna trdnost izolacije, temperatura pregrevanja navitja v načinu delovanja in številni drugi. Pri razvoju tehnološkega procesa izdelave naprav je treba ugotoviti, kako vsak od naštetih dejavnikov vpliva na zmogljivost naprave.

Primer 3

Trolejbusno skladišče služi več trolejbusnim linijam. Upravljajo trolejbuse različnih vrst, 125 inšpektorjev pa pobira vozovnice. Vodstvo depoja zanima vprašanje: kako primerjati ekonomske kazalnike vsakega krmilnika (prihodek) ob upoštevanju različnih prog in različnih vrst trolejbusov? Kako ugotoviti ekonomsko upravičenost proizvodnje trolejbusov določenega tipa na določeni progi? Kako vzpostaviti razumne zahteve glede višine prihodkov, ki jih prinese sprevodnik na vsaki progi v različnih vrstah trolejbusov?

Naloga izbire metode je, kako pridobiti največ informacij o vplivu posameznega dejavnika na končni rezultat, določiti numerične značilnosti takega vpliva, njihovo zanesljivost z minimalnimi stroški in v najkrajšem možnem času. Metode analize variance omogočajo reševanje takšnih problemov.

Univariatna analiza

Namen študije je oceniti velikost vpliva posameznega primera na analizirani pregled. Drug namen univariatne analize je lahko medsebojna primerjava dveh ali več okoliščin, da se ugotovi razlika v njihovem vplivu na priklic. Če je ničelna hipoteza zavrnjena, je naslednji korak kvantifikacija in konstrukcija intervalov zaupanja za dobljene značilnosti. V primeru, da ničelne hipoteze ni mogoče zavrniti, jo običajno sprejmemo in sklepamo o naravi vpliva.

Enosmerna analiza variance lahko postane neparametrični analog Kruskal-Wallisove metode rangiranja. Razvila sta ga ameriški matematik William Kruskal in ekonomist Wilson Wallis leta 1952. Ta kriterij je namenjen testiranju ničelne hipoteze o enakosti učinkov na proučevanih vzorcih z neznanimi, a enakimi povprečnimi vrednostmi. V tem primeru mora biti število vzorcev večje od dveh.

Jonckheere-Terpstra kriterij sta neodvisno predlagala nizozemski matematik T. J. Terpstra leta 1952 in britanski psiholog E. R. Jonckheere leta 1954. Uporablja se, kadar je vnaprej znano, da so obstoječe skupine rezultatov urejene glede na rast vpliva proučevani dejavnik, ki se meri na ordinalni lestvici.

M - Bartlettov test, ki ga je leta 1937 predlagal britanski statistik Maurice Stevenson Bartlett, se uporablja za preverjanje ničelne hipoteze o enakosti varianc več normalnih populacij, iz katerih so vzeti proučevani vzorci, ki imajo običajno različne velikosti (število vsakega vzorec mora biti vsaj štiri).

G - Cochranov test, ki ga je odkril Američan William Gemmell Cochran leta 1941. Uporablja se za preverjanje ničelne hipoteze o enakosti varianc normalnih populacij v neodvisnih enako velikih vzorcih.

Neparametrični Levenov test, ki ga je leta 1960 predlagal ameriški matematik Howard Levene, je alternativa Bartlettovemu testu v pogojih, ko ni zaupanja, da so proučevani vzorci podvrženi normalni porazdelitvi.

Leta 1974 sta ameriška statistika Morton B. Brown in Alan B. Forsythe predlagala test (Brown-Forsythov test), ki se nekoliko razlikuje od Levenovega testa.

Dvofaktorska analiza

Dvosmerna analiza variance se uporablja za povezane normalno porazdeljene vzorce. V praksi se pogosto uporabljajo zapletene tabele te metode, zlasti tiste, v katerih vsaka celica vsebuje nabor podatkov (ponavljajoče se meritve), ki ustrezajo fiksnim vrednostim ravni. Če predpostavke, potrebne za uporabo dvosmerne analize variance, niso izpolnjene, potem uporabite neparametrični Friedmanov rangni test (Friedman, Kendall in Smith), ki ga je razvil ameriški ekonomist Milton Friedman konec leta 1930. Ta test ni odvisen od vrste distribucije.

Predpostavlja se le, da je porazdelitev vrednosti enaka in neprekinjena ter da so same neodvisne druga od druge. Pri testiranju ničelne hipoteze so izhodni podatki predstavljeni v obliki pravokotne matrike, v kateri vrstice ustrezajo nivojem faktorja B, stolpci pa nivojem A. Vsako celico tabele (bloka) lahko rezultat meritev parametrov na enem objektu ali na skupini objektov s stalnimi vrednostmi ravni obeh faktorjev. V tem primeru so ustrezni podatki predstavljeni kot povprečne vrednosti določenega parametra za vse dimenzije ali predmete proučevanega vzorca. Za uporabo izhodnega kriterija je potrebno preiti od neposrednih rezultatov meritev k njihovemu rangu. Razvrstitev se izvaja za vsako vrstico posebej, to pomeni, da so vrednosti razvrščene za vsako fiksno vrednost.

Pageov test (L-test), ki ga je leta 1963 predlagal ameriški statistik E. B. Page, je zasnovan za preverjanje ničelne hipoteze. Za velike vzorce se uporablja Pageov približek. Ti, glede na resničnost ustreznih ničelnih hipotez, upoštevajo standardno normalno porazdelitev. V primeru, da imajo vrstice izvorne tabele enake vrednosti, je treba uporabiti povprečne range. V tem primeru bo natančnost zaključkov slabša, čim večje je število takšnih ujemanj.

Q - Cochranov kriterij, ki ga je predlagal W. Cochran leta 1937. Uporablja se v primerih, ko so skupine homogenih subjektov izpostavljene vplivom, katerih število presega dva in za katere sta možni dve možnosti povratne informacije - pogojno negativna (0) in pogojno pozitivno (1) . Ničelna hipoteza je enakost učinkov zdravljenja. Dvosmerna analiza variance omogoča ugotavljanje obstoja učinkov zdravljenja, ne omogoča pa ugotavljanja, za katere posamezne stolpce ta učinek obstaja. Za rešitev tega problema se uporablja metoda večkratnih Scheffejevih enačb za povezane vzorce.

Multivariatna analiza

Problem multivariatne analize variance se pojavi, ko morate ugotoviti vpliv dveh ali več pogojev na določeno naključno spremenljivko. Študija vključuje prisotnost ene odvisne naključne spremenljivke, izmerjene na lestvici razlike ali razmerja, in več neodvisnih spremenljivk, od katerih je vsaka izražena na poimenovalni ali rang lestvici. Analiza variance podatkov je precej razvit del matematične statistike, ki ima veliko možnosti. Raziskovalni koncept je skupen tako enofaktorskim kot večfaktorskim. Njegovo bistvo je v tem, da je skupna varianca razdeljena na komponente, ki ustrezajo določeni skupini podatkov. Vsaka skupina podatkov ima svoj model. Tukaj bomo upoštevali le osnovne določbe, potrebne za razumevanje in praktično uporabo njegovih najpogosteje uporabljenih možnosti.

Analiza variance faktorjev zahteva dokaj skrben odnos do zbiranja in prikaza vhodnih podatkov, predvsem pa do interpretacije rezultatov. Za razliko od enofaktorskega testa, katerega rezultate lahko pogojno uvrstimo v določeno zaporedje, zahtevajo rezultati dvofaktorskega testa bolj kompleksno predstavitev. Situacija se še bolj zaplete, ko obstajajo tri, štiri ali več okoliščin. Zaradi tega je zelo redko vključiti več kot tri (štiri) pogoje v model. Primer bi bil pojav resonance pri določeni vrednosti kapacitivnosti in induktivnosti električnega kroga; manifestacija kemične reakcije z določenim nizom elementov, iz katerih je sistem zgrajen; pojav nenormalnih učinkov v kompleksnih sistemih ob določenem naključju okoliščin. Prisotnost interakcije lahko radikalno spremeni model sistema in včasih vodi do ponovnega premisleka o naravi pojavov, s katerimi se eksperimentator ukvarja.

Multivariatna analiza variance s ponovljenimi poskusi

Merilne podatke je pogosto mogoče združiti ne po dveh, ampak po večjem številu dejavnikov. Če torej upoštevamo disperzijsko analizo življenjske dobe pnevmatik trolejbusnih koles ob upoštevanju okoliščin (proizvodni obrat in pot, na kateri se pnevmatike uporabljajo), potem lahko kot ločen pogoj izpostavimo sezono, v kateri pnevmatike so v pogonu (in sicer: zimsko in letno obratovanje). Posledično bomo imeli problem trifaktorske metode.

Če je pogojev več, je pristop enak kot pri dvofaktorski analizi. V vseh primerih skušajo model poenostaviti. Pojav interakcije dveh dejavnikov se ne pojavlja tako pogosto, trojna interakcija pa le v izjemnih primerih. Vključite tiste interakcije, za katere obstajajo predhodni podatki in dobri razlogi, da jih upoštevate v modelu. Postopek identifikacije posameznih dejavnikov in njihovega upoštevanja je razmeroma preprost. Zato je pogosto želja po izpostavitvi več okoliščin. Ne bi se smeli zanesti s tem. Več kot je pogojev, manj zanesljiv postane model in večja je verjetnost napake. Sam model, ki vključuje veliko število neodvisnih spremenljivk, postane precej zapleten za interpretacijo in nepriročen za praktično uporabo.

Splošna ideja analize variance

Analiza variance v statistiki je metoda pridobivanja rezultatov opazovanja, odvisnih od različnih sočasno delujočih okoliščin, in ocenjevanja njihovega vpliva. Nadzorovana spremenljivka, ki ustreza metodi vplivanja na predmet študije in v določenem časovnem obdobju pridobi določeno vrednost, se imenuje faktor. Lahko so kvalitativne in kvantitativne. Ravni kvantitativnih pogojev dobijo določen pomen na numerični lestvici. Primeri so temperatura, stiskalni tlak, količina snovi. Kvalitativni dejavniki so različne snovi, različne tehnološke metode, naprave, polnila. Njihove ravni ustrezajo lestvici imen.

Kakovost lahko vključuje tudi vrsto embalažnega materiala in pogoje shranjevanja zdravilne oblike. Prav tako je smiselno vključiti stopnjo mletja surovin, frakcijsko sestavo granul, ki imajo količinski pomen, vendar jih je težko regulirati, če se uporablja kvantitativna lestvica. Število kvalitativnih dejavnikov je odvisno od vrste zdravilne oblike ter fizikalnih in tehnoloških lastnosti zdravilnih učinkovin. Na primer, tablete lahko dobimo iz kristaliničnih snovi z neposrednim stiskanjem. V tem primeru je dovolj, da izberete drsne in mazalne snovi.

Primeri faktorjev kakovosti za različne vrste farmacevtskih oblik

  • Tinkture. Sestava ekstraktorja, vrsta ekstraktorja, metoda priprave surovin, proizvodna metoda, metoda filtracije.
  • Izvlečki (tekoči, gosti, suhi). Sestava ekstraktanta, način ekstrakcije, vrsta naprave, način odstranjevanja ekstraktanta in balastnih snovi.
  • Tablete. Sestava pomožnih snovi, polnil, razgrajevalcev, veziv, lubrikantov in maziv. Način pridobivanja tablet, vrsta tehnološke opreme. Vrsta lupine in njenih sestavnih delov, oblikovalci filma, pigmenti, barvila, mehčala, topila.
  • Raztopine za injiciranje. Vrsta topila, metoda filtracije, vrsta stabilizatorjev in konzervansov, pogoji sterilizacije, način polnjenja ampul.
  • svečke. Sestava osnove svečk, način izdelave svečk, polnila, embalaža.
  • Mazila. Sestava baze, strukturne komponente, način priprave mazila, vrsta opreme, embalaža.
  • Kapsule. Vrsta materiala lupine, način izdelave kapsul, vrsta plastifikatorja, konzervansa, barvila.
  • Linimenti. Način priprave, sestava, vrsta opreme, vrsta emulgatorja.
  • Suspenzije. Vrsta topila, vrsta stabilizatorja, disperzijska metoda.

Primeri dejavnikov kakovosti in njihovih ravni, preučenih med postopkom izdelave tablet

  • Pecilni prašek. Krompirjev škrob, bela glina, mešanica natrijevega bikarbonata s citronsko kislino, bazični magnezijev karbonat.
  • Vezivna raztopina. Voda, škrobna pasta, sladkorni sirup, raztopina metilceluloze, raztopina hidroksipropilmetilceluloze, raztopina polivinilpirolidona, raztopina polivinil alkohola.
  • Drsna snov. Aerosil, škrob, smukec.
  • Polnilo. Sladkor, glukoza, laktoza, natrijev klorid, kalcijev fosfat.
  • Lubrikant. Stearinska kislina, polietilen glikol, parafin.

Modeli analize variance pri preučevanju ravni konkurenčnosti države

Eno najpomembnejših meril za ocenjevanje stanja države, po katerem se ocenjuje stopnja njene blaginje in družbeno-ekonomskega razvoja, je konkurenčnost, to je skupek lastnosti, ki so lastne nacionalnemu gospodarstvu in določajo stanje države. sposobnost tekmovanja z drugimi državami. Po določitvi mesta in vloge države na svetovnem trgu je mogoče oblikovati jasno strategijo za zagotavljanje gospodarske varnosti v mednarodnem merilu, saj je to ključ do pozitivnih odnosov med Rusijo in vsemi akterji na svetovnem trgu: vlagatelji. , upniki in vlade.

Za primerjavo ravni konkurenčnosti držav se države razvrščajo s kompleksnimi indeksi, ki vključujejo različne tehtane kazalnike. Ti indeksi temeljijo na ključnih dejavnikih, ki vplivajo na gospodarsko, politično itd. Nabor modelov za preučevanje konkurenčnosti države vključuje uporabo metod multivariatne statistične analize (zlasti analizo variance (statistika), ekonometrično modeliranje, odločanje) in vključuje naslednje glavne faze:

  1. Oblikovanje sistema indikatorjev.
  2. Ocenjevanje in napovedovanje kazalnikov konkurenčnosti države.
  3. Primerjava kazalnikov konkurenčnosti držav.

Zdaj pa poglejmo vsebino modelov vsake od stopenj tega kompleksa.

Na prvi stopnji z uporabo strokovnih študijskih metod se oblikuje utemeljen nabor ekonomskih kazalnikov za ocenjevanje konkurenčnosti države ob upoštevanju posebnosti njenega razvoja na podlagi mednarodnih ocen in podatkov statističnih oddelkov, ki odražajo stanje sistema kot celote. in njegove procese. Izbira teh kazalnikov je utemeljena s potrebo po izbiri tistih, ki s praktičnega vidika najbolj v celoti omogočajo določitev stopnje stanja, njegove naložbene privlačnosti in možnosti relativne lokalizacije obstoječih potencialnih in dejanskih groženj.

Glavni indikatorji mednarodnih bonitetnih sistemov so indeksi:

  1. Globalna konkurenčnost (GC).
  2. Ekonomska svoboda (IES).
  3. Človekov razvoj (HDI).
  4. Zaznave korupcije (CPC).
  5. Notranje in zunanje grožnje (IETH).
  6. Mednarodni potencial vpliva (IPIP).

Druga faza zagotavlja ocenjevanje in napovedovanje kazalnikov konkurenčnosti države po mednarodnih ocenah za 139 držav sveta, ki se proučujejo.

Tretja stopnja omogoča primerjavo pogojev konkurenčnosti držav z metodami korelacijske in regresijske analize.

Z rezultati študije je mogoče ugotoviti naravo procesov na splošno in za posamezne komponente konkurenčnosti države; preveriti hipotezo o vplivu dejavnikov in njihovih razmerjih na ustrezni stopnji pomembnosti.

Izvedba predlaganega nabora modelov bo omogočila ne le oceno trenutnega stanja ravni konkurenčnosti in naložbene privlačnosti držav, temveč tudi analizo pomanjkljivosti upravljanja, preprečevanje napak zaradi napačnih odločitev in preprečevanje razvoja krize v država.

Analiza variance

1. Koncept analize variance

Analiza variance je analiza variabilnosti lastnosti pod vplivom kakršnih koli nadzorovanih variabilnih dejavnikov. V tuji literaturi se analiza variance pogosto imenuje ANOVA, kar prevajamo kot analiza variabilnosti (Analysis of Variance).

Problem ANOVA sestoji iz izolacije variabilnosti drugačne vrste od splošne variabilnosti lastnosti:

a) variabilnost zaradi delovanja vsake od proučevanih neodvisnih spremenljivk;

b) variabilnost zaradi interakcije neodvisnih spremenljivk, ki se preučujejo;

c) naključna spremenljivka zaradi vseh drugih neznanih spremenljivk.

Spremenljivost zaradi delovanja proučevanih spremenljivk in njihove interakcije je povezana z naključno variabilnostjo. Indikator tega razmerja je Fisherjev F test.

Formula za izračun F kriterija vsebuje ocene varianc, to je porazdelitvenih parametrov atributa, zato je F kriterij parametrični kriterij.

Bolj ko je variabilnost lastnosti posledica spremenljivk (faktorjev), ki jih proučujemo, ali njihove interakcije, večja je vrednosti empiričnega kriterija.

Nič hipoteza pri analizi variance bo trdila, da so povprečne vrednosti proučevane efektivne značilnosti enake v vseh stopnjah.

alternativa hipoteza bo trdila, da so povprečne vrednosti nastale značilnosti v različnih stopnjah proučevanega faktorja različne.

Analiza variance nam omogoča ugotoviti spremembo značilnosti, ne nakazuje pa smer te spremembe.

Začnimo našo obravnavo analize variance z najpreprostejšim primerom, ko preučujemo delovanje samo eno spremenljivka (en faktor).

2. Enosmerna analiza variance za nepovezane vzorce

2.1. Namen metode

Metoda enofaktorske analize variance se uporablja v primerih, ko proučujemo spremembe efektivne značilnosti pod vplivom spreminjajočih se pogojev ali stopnjevanja faktorja. V tej različici metode je vpliv vsake od stopenj faktorja drugačen vzorce predmetov. Obstajati morajo vsaj tri stopnje faktorja. (Lahko obstajata dve stopnji, vendar v tem primeru ne bomo mogli vzpostaviti nelinearnih odvisnosti in se zdi bolj smiselno uporabiti preprostejše).

Neparametrična različica te vrste analize je Kruskal-Wallisov H test.

Hipoteze

H 0: Razlike med razredi faktorjev (različni pogoji) niso večje od naključnih razlik znotraj posamezne skupine.

H 1: Razlike med faktorskimi ocenami (različni pogoji) so večje od naključnih razlik znotraj posamezne skupine.

2.2. Omejitve enosmerne analize variance za nepovezane vzorce

1. Enosmerna analiza variance zahteva vsaj tri gradacije faktorja in vsaj dva subjekta v vsaki gradaciji.

2. Dobljena značilnost mora biti normalno porazdeljena v proučevanem vzorcu.

Res je, običajno ni navedeno, ali govorimo o porazdelitvi značilnosti v celotnem raziskovanem vzorcu ali v tistem njegovem delu, ki sestavlja disperzijski kompleks.

3. Primer reševanja problema z metodo enosmerne analize variance za nepovezane vzorce na primeru:

Tri različne skupine po šest oseb so dobile sezname z desetimi besedami. Prvi skupini so bile besede predstavljene z nizko hitrostjo - 1 beseda na 5 sekund, drugi skupini s povprečno hitrostjo - 1 beseda na 2 sekundi, tretji skupini pa z visoko hitrostjo - 1 beseda na sekundo. Predvideno je, da je zmogljivost reprodukcije odvisna od hitrosti predstavitve besede. Rezultati so predstavljeni v tabeli. 1.

Število reproduciranih besed Tabela 1

Predmet Št.

nizka hitrost

Povprečna hitrost

visoka hitrost

skupni znesek

H 0: Razlike v razponu besedne produkcije med skupine niso nič bolj izrazite kot naključne razlike znotraj vsaka skupina.

H1: Razlike v obsegu besedne produkcije med skupine so bolj izrazite kot naključne razlike znotraj vsaka skupina. Z uporabo eksperimentalnih vrednosti, predstavljenih v tabeli. 1, bomo določili nekaj vrednosti, ki bodo potrebne za izračun F kriterija.

Izračun glavnih količin za enosmerno analizo variance je predstavljen v tabeli:

tabela 2

Tabela 3

Zaporedje operacij pri enosmerni analizi variance za nepovezane vzorce

Oznaka SS, ki jo pogosto najdemo v tej in naslednjih tabelah, je okrajšava za "vsoto kvadratov". Ta okrajšava se najpogosteje uporablja v prevedenih virih.

SS dejstvo pomeni variabilnost značilnosti zaradi delovanja proučevanega dejavnika;

SS na splošno- splošna variabilnost lastnosti;

S C.A.- variabilnost zaradi neupoštevanih dejavnikov, "naključna" ali "preostala" variabilnost.

GOSPA- »povprečni kvadrat« ali matematično pričakovanje vsote kvadratov, povprečna vrednost ustreznega SS.

df - število prostostnih stopenj, ki smo jih pri upoštevanju neparametričnih kriterijev označili z grško črko v.

Zaključek: H 0 je zavrnjen. H 1 je sprejet. Razlike v priklicu besed med skupinami so bile večje od naključnih razlik znotraj posamezne skupine (α=0,05). Hitrost predstavitve besed torej vpliva na obseg njihove reprodukcije.

Spodaj je predstavljen primer rešitve problema v Excelu:

Začetni podatki:

Z ukazom: Orodja->Analiza podatkov->Enosmerna ANOVA dobimo naslednje rezultate:

Zgoraj obravnavane metode za testiranje statističnih hipotez o pomembnosti razlik med dvema povprečjema imajo v praksi omejeno uporabo. To je posledica dejstva, da se za ugotavljanje vpliva vseh možnih pogojev in dejavnikov na učinkovito lastnost terenski in laboratorijski poskusi praviloma izvajajo ne z dvema, temveč z večjim številom vzorcev (1220 ali več). ).

Raziskovalci pogosto primerjajo sredstva več vzorcev, združenih v en sam kompleks. Na primer, pri preučevanju vpliva različnih vrst in odmerkov gnojil na pridelek se poskusi ponavljajo v različnih različicah. V teh primerih postanejo primerjave parov okorne, statistična analiza celotnega kompleksa pa zahteva uporabo posebne metode. Ta metoda, razvita v matematični statistiki, se imenuje analiza variance. Prvi jo je uporabil angleški statistik R. Fisher pri obdelavi rezultatov agronomskih poskusov (1938).

Analiza variance je metoda za statistično ocenjevanje zanesljivosti manifestacije odvisnosti efektivne lastnosti od enega ali več dejavnikov. Z metodo analize variance se testirajo statistične hipoteze o povprečjih v več splošnih populacijah, ki imajo normalno porazdelitev.

Analiza variance je ena glavnih metod za statistično vrednotenje eksperimentalnih rezultatov. Vse bolj se uporablja tudi pri analizi ekonomskih informacij. Z analizo variance je mogoče ugotoviti, v kolikšni meri vzorčni kazalniki razmerja med rezultantnimi in faktorskimi značilnostmi zadostujejo za razširitev podatkov, pridobljenih iz vzorca, na splošno populacijo. Prednost te metode je, da daje dokaj zanesljive zaključke iz majhnih vzorcev.

S preučevanjem variacije efektivne značilnosti pod vplivom enega ali več dejavnikov z analizo variance lahko poleg splošnih ocen pomembnosti odvisnosti pridobimo tudi oceno razlik v velikosti povprečij, ki se oblikujejo pri različne ravni dejavnikov in pomen medsebojnega delovanja dejavnikov. Analiza variance se uporablja za preučevanje odvisnosti kvantitativnih in kvalitativnih značilnosti ter njihove kombinacije.

Bistvo te metode je statistična študija verjetnosti vpliva enega ali več dejavnikov, pa tudi njihovega medsebojnega delovanja na nastalo značilnost. V skladu s tem se z analizo variance rešujejo tri glavne naloge: 1) splošna ocena pomembnosti razlik med skupinskimi sredstvi; 2) ocenjevanje verjetnosti interakcije med dejavniki; 3) ocena pomembnosti razlik med pari povprečij. Najpogosteje morajo raziskovalci reševati takšne probleme pri izvajanju terenskih in zootehniških poskusov, ko preučujejo vpliv več dejavnikov na učinkovito lastnost.

Načelna shema analize variance vključuje ugotavljanje glavnih virov variacije efektivne karakteristike in določanje obsega variacije (vsote kvadratov odstopanj) glede na vire njenega nastanka; določanje števila prostostnih stopenj, ki ustrezajo komponentam celotne variacije; izračunavanje disperzij kot razmerje med ustreznimi volumni variacije in njihovim številom prostostnih stopenj; analiza razmerja med variancami; ocenjevanje zanesljivosti razlike med sredstvi in ​​sklepanje.

Ta shema je ohranjena tako v preprostih modelih analize variance, ko so podatki razvrščeni po eni značilnosti, kot v kompleksnih modelih, ko so podatki razvrščeni po dveh ali več značilnostih. S povečanjem števila skupinskih značilnosti pa postane proces razgradnje celotne variacije glede na vire njenega nastanka bolj zapleten.

Glede na načelni diagram lahko analizo variance predstavimo v obliki petih zaporednih stopenj:

1) opredelitev in razširitev variacije;

2) določitev števila variacijskih stopenj svobode;

3) izračun varianc in njihovih razmerij;

4) analiza varianc in njihovih razmerij;

5) ocenjevanje pomembnosti razlike med srednjimi vrednostmi in oblikovanje zaključkov za testiranje ničelne hipoteze.

Najbolj delovno intenziven del analize variance je prva faza - določanje in razčlenitev variacije glede na vire njenega nastanka. Vrstni red razgradnje skupnega volumna variacije je bil podrobno obravnavan v 5. poglavju.

Osnova za reševanje problemov analize variance je zakon razširitve (seštevanja) variacije, po katerem se skupna variacija (nihanja) nastalega atributa razdeli na dvoje: variacijo, ki jo povzroči delovanje proučevanega(-ih) faktorja(-ov) , in variacija, ki jo povzroči delovanje naključnih vzrokov, tj

Predpostavimo, da je proučevana populacija razdeljena glede na faktorske značilnosti v več skupin, od katerih je vsaka označena s svojo povprečno vrednostjo nastale značilnosti. Hkrati je spremembo teh vrednosti mogoče pojasniti z dvema vrstama razlogov: tistimi, ki delujejo na učinkovit znak sistematično in jih je mogoče prilagoditi med poskusom, in tistimi, ki jih ni mogoče prilagoditi. Očitno je, da je medskupinska (faktorska ali sistematična) variacija odvisna predvsem od delovanja proučevanega dejavnika, znotrajskupinska (rezidualna ali naključna) variacija pa je odvisna predvsem od delovanja naključnih dejavnikov.

Za oceno zanesljivosti razlik med skupinskimi povprečji je treba določiti medskupinske in znotrajskupinske variacije. Če medskupinska (faktorialna) variacija bistveno presega znotrajskupinsko (rezidualno) variacijo, potem je faktor vplival na nastalo značilnost in bistveno spremenil vrednosti skupinskih povprečij. Postavlja pa se vprašanje, kakšno je razmerje med medskupinskimi in znotrajskupinskimi variacijami, ki se lahko šteje za zadostno za sklepanje o zanesljivosti (pomembnosti) razlik med skupinskimi povprečji.

Za oceno pomembnosti razlik med povprečji in oblikovanje zaključkov za testiranje ničelne hipoteze (H0:x1 = x2 =... = xn) v analizi variance se uporablja neke vrste standard - G-kriterij, porazdelitveni zakon ki jo je ustanovil R. Fisher. To merilo je razmerje dveh varianc: faktorske, ki nastane zaradi delovanja preučevanega dejavnika, in rezidualne, ki nastane zaradi delovanja naključnih vzrokov:

Disperzijsko razmerje Γ = £>u : Ameriški statistik Snedecor je predlagal označevanje £*2 s črko G v čast izumitelju analize variance R. Fisherju.

Variance °2 io2 so ocene variance populacije. Če so vzorci z variancami °2 °2 narejeni iz iste splošne populacije, kjer je bila variacija vrednosti naključna, potem je tudi odstopanje v vrednosti °2 °2 naključno.

Če s poskusom preizkušamo vpliv več dejavnikov (A, B, C itd.) na učinkovito lastnost hkrati, mora biti varianca zaradi delovanja vsakega od njih primerljiva z °e.gP, to je

Če je vrednost faktorske disperzije bistveno večja od reziduala, potem je faktor pomembno vplival na nastali atribut in obratno.

Pri večfaktorskih poskusih je poleg variacije zaradi delovanja posameznega faktorja skoraj vedno variacija zaradi interakcije dejavnikov ($ав: ^лс ^вс $ліс). Bistvo interakcije je, da se učinek enega dejavnika bistveno spremeni na različnih ravneh drugega (na primer učinkovitost kakovosti tal pri različnih odmerkih gnojil).

Medsebojno delovanje dejavnikov je treba oceniti tudi s primerjavo ustreznih varianc 3 ^v.gr:

Pri izračunu dejanske vrednosti B-merila se v števcu vzame večja od varianc, tako da je B > 1. Očitno je, da večji kot je B kriterij, pomembnejše so razlike med variancami. Če je B = 1, potem odpade vprašanje ocenjevanja pomembnosti razlik v variancah.

Za določitev meja naključnih nihanj v razmerju disperzij je G. Fischer razvil posebne B-razdelitvene tabele (prilogi 4 in 5). Merilo bi bilo funkcionalno povezano z verjetnostjo in je odvisno od števila stopenj svobode variacije k1 in k2 dveh primerjanih varianc. Običajno se za sklepanje o izjemno visoki vrednosti kriterija za ravni pomembnosti 0,05 in 0,01 uporabljata dve tabeli. Raven pomembnosti 0,05 (ali 5 %) pomeni, da lahko le v 5 primerih od 100 kriterij B zavzame vrednost, ki je enaka ali višja od tiste, ki je navedena v tabeli. Zmanjšanje stopnje pomembnosti z 0,05 na 0,01 povzroči povečanje vrednosti kriterija med dvema variancama zaradi vpliva zgolj naključnih razlogov.

Vrednost kriterija je neposredno odvisna tudi od števila prostostnih stopenj obeh primerjanih disperzij. Če število prostostnih stopinj teži k neskončnosti (k-me), potem razmerje B za dve disperziji teži k enoti.

Tabelarna vrednost kriterija B prikazuje možno naključno vrednost razmerja dveh varianc na dani ravni pomembnosti in ustrezno število prostostnih stopenj za vsako od primerjanih varianc. Navedene tabele prikazujejo vrednost B za vzorce, izdelane iz iste splošne populacije, kjer so razlogi za spremembe vrednosti le naključni.

Vrednost Γ najdemo iz tabel (priloga 4 in 5) na presečišču ustreznega stolpca (število prostostnih stopinj za večjo disperzijo - k1) in vrstico (število prostostnih stopinj za manjšo disperzijo - k2 ). Torej, če je večja varianca (števec Г) k1 = 4, manjša varianca (imenovalec Г) pa k2 = 9, potem bo G na ravni pomembnosti a = 0,05 3,63 (Priloga 4). Torej, kot posledica naključnih vzrokov, ker so vzorci majhni, lahko varianca enega vzorca pri 5% stopnji pomembnosti preseže varianco drugega vzorca za 3,63-krat. Ko se stopnja pomembnosti zmanjša z 0,05 na 0,01, se tabelarična vrednost kriterija G, kot je navedeno zgoraj, poveča. Tako bo pri enakih prostostnih stopnjah k1 = 4 in k2 = 9 ter a = 0,01 tabelarična vrednost kriterija G 6,99 (Priloga 5).

Oglejmo si postopek za določanje števila prostostnih stopenj pri analizi variance. Število svobodnih stopenj, ki ustreza skupni vsoti kvadratov odklonov, razčlenimo na ustrezne komponente podobno kot pri razgradnji vsot kvadratov odklonov (^total = No^gr + ]¥vhr), to je skupno število prostostnih stopenj (k") je razčlenjeno na število prostostnih stopinj za medskupinske (k1) in znotrajskupinske (k2) variacije.

Torej, če je vzorčna populacija sestavljena iz n opazovanja deljena s T skupine (število poskusnih možnosti) in p podskupin (število ponovitev), potem bo število prostostnih stopenj k temu primerno:

a) za skupno vsoto kvadratov odstopanj (s7zag)

b) za medskupinsko vsoto kvadratov odstopanj ^m.gP)

c) za znotrajskupinsko vsoto kvadratov odstopanj V v.gR)

Po pravilu za dodajanje različic:

Na primer, če so bile v poskusu oblikovane štiri različice poskusa (t = 4) v petih ponovitvah (n = 5), skupno število opazovanj pa je N = = T o p = 4 * 5 = 20, potem je število prostostnih stopinj ustrezno enako:

Če poznamo vsoto kvadratov odstopanj in število prostostnih stopinj, lahko določimo nepristranske (popravljene) ocene za tri variance:

Ničelna hipoteza H0 se testira z uporabo kriterija B na enak način kot z uporabo Studentovega t-testa. Za odločitev o preverjanju H0 je treba izračunati dejansko vrednost kriterija in jo primerjati s tabelarno vrednostjo Ba za sprejeto stopnjo pomembnosti a in število prostostnih stopinj. k1 in k2 za dve disperziji.

Če je Bfaq > Ba, potem lahko v skladu s sprejeto stopnjo pomembnosti sklepamo, da razlike v vzorčnih variancah niso določene samo z naključnimi dejavniki; so pomembni. V tem primeru je ničelna hipoteza zavrnjena in obstaja razlog za trditev, da faktor pomembno vpliva na nastalo značilnost. če< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Uporaba določenega modela analize variance je odvisna tako od števila preučevanih dejavnikov kot od metode vzorčenja.

c Glede na število dejavnikov, ki določajo variacijo dobljene lastnosti, se lahko vzorci oblikujejo po enem, dveh ali več dejavnikih. Glede na to analizo variance delimo na enofaktorsko in večfaktorsko. Drugače ga imenujemo tudi enofaktorski in večfaktorski disperzijski kompleks.

Shema razgradnje celotne variacije je odvisna od oblikovanja skupin. Lahko je naključna (opazovanja ene skupine niso povezana z opazovanji druge skupine) in nenaključna (opazovanja dveh vzorcev so med seboj povezana s podobnostjo eksperimentalnih pogojev). V skladu s tem se pridobijo neodvisni in odvisni vzorci. Neodvisni vzorci se lahko oblikujejo tako z enakim kot neparnim številom. Oblikovanje odvisnih vzorcev predpostavlja njihovo enako velikost.

Če so skupine oblikovane po naključnem vrstnem redu, potem skupni obseg variacije nastale lastnosti vključuje poleg faktorske (medskupinske) in rezidualne variacije še variacijo ponovitev, tj.

V praksi je v večini primerov potrebno upoštevati odvisne vzorce, ko so pogoji za skupine in podskupine izenačeni. Tako je v terenskem poskusu celotno mesto razdeljeno na bloke z najrazličnejšimi pogoji. V tem primeru ima vsaka možnost eksperimenta enake možnosti za zastopanost v vseh blokih, s čimer se izenačijo pogoji za vse preizkušene možnosti in izkušnje. Ta metoda konstruiranja eksperimenta se imenuje metoda naključnega bloka. Podobno se izvajajo poskusi z živalmi.

Pri obdelavi socialno-ekonomskih podatkov z metodo analize variance je treba upoštevati, da je zaradi velikega števila dejavnikov in njihove medsebojne povezanosti težko, tudi pri najprevidnejšem niveliranju pogojev, ugotoviti stopnjo objektivnosti. vpliv vsakega posameznega dejavnika na nastalo lastnost. Zato stopnjo preostale variacije ne določajo le naključni vzroki, ampak tudi pomembni dejavniki, ki niso bili upoštevani pri izdelavi modela analize variance. Posledica tega je, da preostala varianca kot osnova za primerjavo včasih postane neustrezna za svoj namen; je očitno precenjena po vrednosti in ne more delovati kot merilo za pomembnost vpliva dejavnikov. V zvezi s tem pri izdelavi modelov analize variance postane pomemben problem izbire najpomembnejših dejavnikov in izravnave pogojev za manifestacijo delovanja vsakega od njih. Poleg tega. uporaba analize variance predvideva normalno ali skoraj normalno porazdelitev proučevanih statističnih populacij. Če ta pogoj ni izpolnjen, bodo ocene, pridobljene pri analizi variance, pretirane.

Človek lahko prepozna svoje sposobnosti le tako, da jih poskuša uporabiti. (Seneka)

Analiza variance

Uvodni pregled

V tem razdelku bomo pregledali osnovne metode, predpostavke in terminologijo ANOVE.

Upoštevajte, da se v literaturi v angleškem jeziku analiza variance običajno imenuje analiza variacije. Zato bomo zaradi jedrnatosti v nadaljevanju včasih uporabljali izraz ANOVA (An analiza o f va rijacija) za navadno ANOVO in izraz MANOVA za multivariatno analizo variance. V tem razdelku bomo zaporedno pregledali glavne ideje analize variance ( ANOVA), analiza kovariance ( ANCOVA), multivariatna analiza variance ( MANOVA) in multivariatna analiza kovariance ( MANCOVA). Po kratki razpravi o prednostih kontrastne analize in post hoc testov si poglejmo predpostavke, na katerih temeljijo metode ANOVA. Proti koncu tega razdelka so razložene prednosti multivariatnega pristopa za analizo ponovljenih meritev pred tradicionalnim univariatnim pristopom.

Ključne ideje

Namen analize variance. Glavni namen analize variance je preučiti pomembnost razlik med povprečji. Odsek (8. poglavje) ponuja kratek uvod v študijo statistične pomembnosti. Če preprosto primerjate povprečja dveh vzorcev, bo analiza variance dala enak rezultat kot običajna analiza. t- test za neodvisne vzorce (če primerjamo dve neodvisni skupini predmetov oz. opazovanj) oz t- kriterij za odvisne vzorce (če dve spremenljivki primerjamo na istem nizu predmetov ali opazovanj). Če teh kriterijev niste seznanjeni, vam priporočamo, da si ogledate uvodni pregled poglavja (9. poglavje).

Od kod ime Analiza variance? Morda se zdi čudno, da se postopek primerjave povprečij imenuje analiza variance. V resnici je to zato, ker ko preučujemo statistično pomembnost razlik med sredstvi, dejansko analiziramo variance.

Delitev vsote kvadratov

Za velikost vzorca n se vzorčna varianca izračuna kot vsota kvadratov odstopanj od povprečja vzorca, deljena z n-1 (velikost vzorca minus ena). Tako je za fiksno velikost vzorca n varianca funkcija vsote kvadratov (odklonov), ki je za kratkost označena z SS(iz angleške vsote kvadratov - vsota kvadratov). Osnova analize variance je ločevanje (ali razdelitev) variance na dele. Razmislite o naslednjem nizu podatkov:

Srednji vrednosti obeh skupin sta pomembno različni (2 oziroma 6). Vsota kvadratov odstopanj znotraj vsaka skupina je enaka 2. Če jih seštejemo, dobimo 4. Če zdaj ponovimo te izračune izključujoč pripadnost skupini, torej če izračunamo SS na podlagi celotnega povprečja obeh vzorcev dobimo 28. Z drugimi besedami, varianca (vsota kvadratov), ​​ki temelji na variabilnosti znotraj skupine, povzroči veliko manjše vrednosti kot pri izračunu na podlagi celotne variabilnosti (glede na skupno povprečje). Razlog za to je očitno velika razlika med povprečji in ta razlika med povprečji pojasnjuje obstoječo razliko med vsotami kvadratov. Pravzaprav, če uporabljate modul za analizo danih podatkov Analiza variance, bodo pridobljeni naslednji rezultati:

Kot je razvidno iz tabele, skupna vsota kvadratov SS=28 je deljeno z vsoto kvadratov, podano z znotraj skupine variabilnost ( 2+2=4 ; glej drugo vrstico tabele) in vsota kvadratov zaradi razlike v srednjih vrednostih. (28-(2+2)=24; glej prvo vrstico tabele).

SS napake inSS učinek. Spremenljivost znotraj skupine ( SS) običajno imenujemo disperzija napake. To pomeni, da poskusa običajno ni mogoče predvideti ali razložiti. Na drugi strani, SS učinek(ali variabilnost med skupinami) je mogoče pojasniti z razlikami med povprečji študijskih skupin. Z drugimi besedami, pripadnost določeni skupini pojasnjuje medskupinska variabilnost, saj vemo, da imajo te skupine različna sredstva.

Preverjanje pomembnosti. Osnovne zamisli o testiranju statistične pomembnosti so obravnavane v poglavju Osnovni pojmi statistike(8. poglavje). To poglavje pojasnjuje tudi razloge, zakaj številni testi uporabljajo razmerje med razloženo in nepojasnjeno varianco. Primer te uporabe je analiza same variance. Testiranje pomembnosti pri analizi variance temelji na primerjavi variance zaradi variance med skupinami (imenovano srednji kvadratni učinek oz GOSPAUčinek) in varianco zaradi variacije znotraj skupine (imenovano povprečna kvadratna napaka oz GOSPAnapaka). Če je ničelna hipoteza (enakost povprečij v obeh populacijah) resnična, potem bi pričakovali razmeroma majhno razliko v vzorčnih povprečjih zaradi naključne variacije. Zato bo v skladu z ničelno hipotezo varianca znotraj skupine praktično sovpadala s skupno varianco, izračunano brez upoštevanja članstva v skupini. Dobljene variance znotraj skupine je mogoče primerjati z uporabo F- test, ki preveri, ali je razmerje variance bistveno večje od 1. V zgoraj obravnavanem primeru F- kriterij kaže, da je razlika med sredinama statistično pomembna.

Osnovna logika analize variance.Če povzamemo, namen ANOVA je preizkusiti statistično pomembnost razlike med povprečji (za skupine ali spremenljivke). To preverjanje se izvaja z analizo variance, tj. z delitvijo celotne variance (variacije) na dele, od katerih je eden posledica naključne napake (to je variabilnost znotraj skupine), drugi pa je povezan z razlikami v srednjih vrednostih. Zadnja komponenta variance se nato uporabi za analizo statistične pomembnosti razlike med srednjimi vrednostmi. Če je razlika pomembna, se ničelna hipoteza zavrne in sprejme alternativna hipoteza, da obstaja razlika med sredinama.

Odvisne in neodvisne spremenljivke. Imenujejo se spremenljivke, katerih vrednosti so določene z meritvami med poskusom (na primer rezultat testa). odvisen spremenljivke. Spremenljivke, ki jih je mogoče nadzorovati v eksperimentu (kot so učne metode ali druga merila za ločevanje opazovanj v skupine), imenujemo dejavniki oz neodvisen spremenljivke. Ti koncepti so podrobneje opisani v poglavju Osnovni pojmi statistike(8. poglavje).

Multivariatna analiza variance

V zgornjem preprostem primeru bi lahko takoj izračunali t-test neodvisnih vzorcev z uporabo ustrezne možnosti modula Osnovne statistike in tabele. Dobljeni rezultati bodo seveda sovpadali z rezultati analize variance. Vendar pa ANOVA vsebuje prilagodljive in zmogljive tehnike, ki jih je mogoče uporabiti za veliko bolj zapletene študije.

Veliko dejavnikov. Svet je po naravi kompleksen in večdimenzionalen. Situacije, ko je določen pojav v celoti opisan z eno spremenljivko, so izjemno redke. Na primer, če se želimo naučiti gojiti velike paradižnike, moramo upoštevati dejavnike, povezane z genetsko strukturo rastline, vrsto tal, svetlobo, temperaturo itd. Tako je treba pri izvajanju tipičnega poskusa obravnavati veliko število dejavnikov. Glavni razlog, zakaj je uporaba ANOVA boljša od ponavljajočih se primerjav dveh vzorcev na različnih ravneh faktorjev t- merilo je, da je analiza variance večja učinkovito in za majhne vzorce bolj informativen.

Upravljanje faktorjev. Recimo, da v zgoraj obravnavanem primeru analize dveh vzorcev dodamo še en dejavnik, npr. Nadstropje- Spol. Vsako skupino naj sestavljajo 3 moški in 3 ženske. Zasnova tega poskusa je lahko predstavljena v obliki tabele 2 x 2:

Eksperimentirajte. 1. skupina Eksperimentirajte. 2. skupina
moški2 6
3 7
1 5
Povprečje2 6
ženske4 8
5 9
3 7
Povprečje4 8

Preden začnete z izračuni, lahko opazite, da ima v tem primeru skupna varianca vsaj tri vire:

(1) naključna napaka (znotraj skupinske variance),

(2) variabilnost, povezana s članstvom v eksperimentalni skupini, in

(3) variabilnost zaradi spola objektov opazovanja.

(Upoštevajte, da obstaja še en možen vir spremenljivosti – interakcija dejavnikov, o čemer bomo razpravljali kasneje). Kaj se zgodi, če ne vključimo nadstropjespol kot dejavnik pri analizi in izračunajte običajno t-merilo? Če izračunamo vsoto kvadratov, ne upoštevamo nadstropje -spol(tj. združevanje predmetov različnih spolov v eno skupino pri izračunu variance znotraj skupine, pridobitev vsote kvadratov za vsako skupino, ki je enaka SS=10 in skupno vsoto kvadratov SS= 10+10 = 20), potem dobimo večjo vrednost znotrajskupinske variance kot z natančnejšo analizo z dodatno delitvijo na podskupine glede na pol- spol(v tem primeru bo sredina znotraj skupine enaka 2, skupna vsota kvadratov znotraj skupine pa bo enaka SS = 2+2+2+2 = 8). Ta razlika je posledica dejstva, da je povprečna vrednost za moški - samci manj od povprečja za ženske –ženska, in ta razlika v povprečju poveča splošno variabilnost znotraj skupine, če spola ne upoštevamo. Nadzor variance napake poveča občutljivost (moč) testa.

Ta primer prikazuje še eno prednost analize variance v primerjavi s konvencionalno t- merilo za dva vzorca. Analiza variance vam omogoča, da preučite vsak faktor z nadzorom vrednosti preostalih faktorjev. To je pravzaprav glavni razlog za njegovo večjo statistično moč (za pridobitev smiselnih rezultatov so potrebni manjši vzorci). Zaradi tega analiza variance tudi na majhnih vzorcih daje statistično pomembnejše rezultate kot preprosta t- merilo.

Učinki interakcije

Obstaja še ena prednost uporabe analize variance v primerjavi s konvencionalno t- kriterij: analiza variance nam omogoča zaznati interakcija med dejavniki in zato omogoča preučevanje kompleksnejših modelov. Za ponazoritev razmislite o drugem primeru.

Glavni učinki, parne (dvofaktorske) interakcije. Predpostavimo, da obstajata dve skupini učencev in psihološko so učenci prve skupine odločeni, da opravijo zadane naloge in so bolj namenski kot učenci druge skupine, ki jo sestavljajo bolj leni učenci. Vsako skupino naključno razdelimo na pol in dajmo eni polovici vsake skupine težko nalogo, drugi polovici pa enostavno. Nato bomo izmerili, kako prizadevni so učenci pri teh nalogah. Povprečja za to (izmišljeno) študijo so prikazana v tabeli:

Kakšen sklep je mogoče potegniti iz teh rezultatov? Ali lahko sklepamo, da: (1) učenci intenzivneje delajo na kompleksni nalogi; (2) Ali se motivirani učenci bolj trudijo kot leni učenci? Nobena od teh izjav ne zajame bistva sistematične narave sredstev, prikazanih v tabeli. Če analiziramo rezultate, bi bilo pravilneje reči, da se pri težjih nalogah bolj potrudijo samo motivirani učenci, pri lažjih pa le leni učenci. Z drugimi besedami, karakter učencev in težavnost naloge interakcijo vplivajo drug na drugega na vložen trud. To je primer interakcija v paru med značajem učencev in težavnostjo naloge. Upoštevajte, da izjavi 1 in 2 opisujeta glavni učinki.

Interakcije višjega reda. Medtem ko je interakcije po parih še vedno relativno enostavno razložiti, je interakcije višjega reda veliko težje razložiti. Predstavljajmo si, da je v zgornjem primeru uveden še en dejavnik nadstropje -Spol in dobili smo naslednjo tabelo povprečij:

Kakšne zaključke je zdaj mogoče potegniti iz dobljenih rezultatov? Srednje ploskve olajšajo interpretacijo kompleksnih učinkov. Modul ANOVA vam omogoča gradnjo teh grafov s skoraj enim klikom miške.

Slika v spodnjih grafih predstavlja preučevano interakcijo treh faktorjev.

Če pogledamo grafe, lahko ugotovimo, da pri ženskah obstaja interakcija med osebnostjo in težavnostjo testa: motivirane ženske se bolj potrudijo pri težki nalogi kot pri lažji. Pri moških je enaka interakcija obratna. Vidimo lahko, da postane opis interakcije med dejavniki bolj zmeden.

Splošni način za opis interakcij. Na splošno je interakcija med dejavniki opisana kot sprememba enega učinka pod vplivom drugega. V zgoraj obravnavanem primeru lahko dvofaktorsko interakcijo opišemo kot spremembo glavnega učinka dejavnika, ki označuje kompleksnost naloge, pod vplivom dejavnika, ki opisuje značaj študenta. Za interakcijo treh dejavnikov iz prejšnjega odstavka lahko rečemo, da se interakcija dveh dejavnikov (zahtevnost naloge in karakter študenta) spremeni pod vplivom spolSpol. Če proučujemo medsebojno delovanje štirih dejavnikov, lahko rečemo, da se medsebojno delovanje treh faktorjev spreminja pod vplivom četrtega faktorja, tj. Na različnih ravneh četrtega faktorja obstajajo različne vrste interakcij. Izkazalo se je, da na mnogih področjih interakcija petih ali celo več dejavnikov ni nič nenavadnega.

Zapleteni načrti

Načrti med skupinami in znotraj skupine (načrti ponovljenih meritev)

Pri primerjavi dveh različnih skupin se običajno uporablja t- kriterij za neodvisne vzorce (iz modula Osnovne statistike in tabele). Ko primerjamo dve spremenljivki na istem nizu objektov (opazovanja), se uporabi t-merilo za odvisne vzorce. Za analizo variance je pomembno tudi, ali so vzorci odvisni ali ne. Če se ponavljajo meritve istih spremenljivk (pod različnimi pogoji ali ob različnih časih) za iste predmete, potem govorijo o prisotnosti faktor ponavljajočih se meritev(imenovano tudi znotrajskupinski faktor, ker se za oceno pomembnosti izračuna vsota kvadratov znotraj skupine). Če primerjamo različne skupine predmetov (na primer moške in ženske, tri seve bakterij itd.), potem je opisana razlika med skupinami medskupinski faktor. Metode za izračun kriterijev pomembnosti za obe opisani vrsti faktorjev so različne, vendar sta njihova splošna logika in interpretacije enaki.

Načrti med in znotraj skupine. V mnogih primerih poskus zahteva vključitev dejavnika med subjekti in faktorja ponavljajočih se meritev v zasnovo. Merijo se na primer matematične sposobnosti dijakov in dijakov (kjer nadstropje -Spol-medskupinski faktor) na začetku in koncu semestra. Dve meritvi spretnosti vsakega študenta tvorita faktor znotraj skupine (faktor ponovljenih meritev). Interpretacija glavnih učinkov in interakcij za dejavnike med predmeti in ponavljajočimi se meritvami je dosledna in obe vrsti dejavnikov lahko očitno medsebojno vplivata (npr. ženske pridobijo spretnosti tekom semestra, medtem ko jih moški izgubijo).

Nepopolni (gnezdeni) načrti

V mnogih primerih lahko učinek interakcije zanemarimo. To se zgodi bodisi takrat, ko je znano, da interakcijskega učinka v populaciji ni, bodisi ko je izvajanje popolno faktorial načrt je nemogoč. Na primer, proučuje se učinek štirih aditivov za gorivo na porabo goriva. Izbrani so štirje avtomobili in štirje vozniki. Poln faktorial poskus zahteva, da se vsaka kombinacija: aditiv, voznik, avto - pojavi vsaj enkrat. To zahteva vsaj 4 x 4 x 4 = 64 skupin testov, kar je preveč zamudno. Poleg tega ni verjetno nobene interakcije med voznikom in aditivom za gorivo. Ob upoštevanju tega lahko uporabite načrt latinski kvadrati, ki vsebuje samo 16 testnih skupin (štirje aditivi so označeni s črkami A, B, C in D):

Latinski kvadrati so opisani v večini knjig o eksperimentalnem načrtovanju (npr. Hays, 1988; Lindman, 1974; Milliken in Johnson, 1984; Winer, 1962) in jih tukaj ne bomo podrobneje obravnavali. Upoštevajte, da so latinski kvadrati nenpoln zasnove, v katere niso vključene vse kombinacije ravni faktorjev. Na primer, voznik 1 vozi avto 1 samo z dodatkom A, voznik 3 vozi avto 1 samo z dodatkom C. Stopnje faktorjev dodatki ( A, B, C in D) so ugnezdeni v celicah tabele avtomobilski x voznik - kot jajca v gnezdu. Ta mnemotehnika je uporabna za razumevanje narave ugnezdeni ali ugnezdeni načrti. Modul Analiza variance ponuja preproste načine za analizo teh vrst načrtov.

Kovariančna analiza

glavna ideja

V poglavju Ključne ideje Na kratko smo razpravljali o ideji nadzora faktorjev in o tem, kako vključitev aditivnih faktorjev zmanjša vsoto kvadratov napak in poveča statistično moč zasnove. Vse to je mogoče razširiti na spremenljivke z zveznim nizom vrednosti. Ko so takšne zvezne spremenljivke vključene kot dejavniki v zasnovo, se imenujejo sospremenljivke.

Fiksne spremenljivke

Recimo, da primerjamo matematične sposobnosti dveh skupin učencev, ki so se učili po dveh različnih učbenikih. Predpostavimo tudi, da so podatki o inteligenčnem kvocientu (IQ) na voljo za vsakega učenca. Lahko domnevate, da je IQ povezan z matematičnimi veščinami in uporabite to informacijo. Za vsako od obeh skupin študentov je mogoče izračunati korelacijski koeficient med IQ in matematičnimi veščinami. Z uporabo tega korelacijskega koeficienta je mogoče izolirati delež variance v skupinah, ki je razložen z vplivom IQ in nepojasnjenim deležem variance (glej tudi Osnovni pojmi statistike(8. poglavje) in Osnovne statistike in tabele(poglavje 9)). Preostali del variance se v analizi uporabi kot varianca napake. Če obstaja korelacija med IQ in matematičnimi veščinami, se lahko varianca napake znatno zmanjša SS/(n-1) .

Vpliv sospremenljivk naF- merilo. F- kriterij ovrednoti statistično pomembnost razlike v srednjih vrednostih v skupinah in izračuna razmerje medskupinske variance ( GOSPAučinek) na odstopanje napak ( GOSPAnapaka) . če GOSPAnapaka zmanjša, denimo, ob upoštevanju faktorja IQ vrednost F poveča.

Veliko sospremenljivk. Utemeljitev, uporabljeno zgoraj za posamezno kospremenljivko (IQ), je mogoče enostavno razširiti na več kospremenljivk. Na primer, poleg IQ lahko vključite meritve motivacije, prostorskega razmišljanja itd. Namesto običajnega korelacijskega koeficienta se uporablja multipli korelacijski koeficient.

Ko vrednostF -kriteriji se zmanjšajo. Včasih uvedba sospremenljivk v načrt eksperimenta zmanjša pomembnost F-merila . To običajno pomeni, da so spremenljivke povezane ne le z odvisno spremenljivko (npr. znanje matematike), ampak tudi s faktorji (npr. različni učbeniki). Recimo, da je IQ izmerjen ob koncu semestra, po skoraj enem letu poučevanja dveh skupin študentov po dveh različnih učbenikih. Čeprav so bili učenci v skupine razporejeni naključno, se lahko zgodi, da so razlike v učbenikih tako velike, da se bodo IQ in matematične sposobnosti med skupinami močno razlikovale. V tem primeru kospremenljivke ne zmanjšajo le variance napake, temveč tudi variance med skupinami. Z drugimi besedami, po nadzoru razlik v IQ med skupinami razlike v matematičnih veščinah niso več pomembne. Lahko rečeš drugače. Po »izključitvi« vpliva IQ je nenamerno izključen vpliv učbenika na razvoj matematičnih sposobnosti.

Prilagojena povprečja. Kadar sospremenljivka vpliva na faktor med subjekti, je treba izračunati prilagojena sredstva, tj. tiste sredine, ki so dobljene po odstranitvi vseh ocen kovariatov.

Interakcije med kospremenljivkami in faktorji. Tako kot se preučujejo interakcije med dejavniki, je mogoče preučiti interakcije med kospremenljivkami in med skupinami dejavnikov. Recimo, da je eden od učbenikov primeren predvsem za pametne učence. Drugi učbenik je za pametne učence dolgočasen, za manj pametne pa je isti učbenik težak. Posledično obstaja pozitivna korelacija med IQ in učnim rezultatom v prvi skupini (pametnejši učenci, boljši rezultati) in ničelna ali rahlo negativna korelacija v drugi skupini (pametnejši kot je učenec, manjša je verjetnost, da bo pridobil matematične sposobnosti). iz drugega učbenika). Nekatere študije obravnavajo to situacijo kot primer kršitve predpostavk analize kovariance. Ker pa modul ANOVA uporablja najpogostejše metode analize kovarianc, je mogoče oceniti predvsem statistično pomembnost interakcije med faktorji in kovariantami.

Kovariate spremenljivk

Medtem ko so fiksne kovariate v učbenikih precej pogosto obravnavane, so spremenljive kovariate omenjene veliko manj pogosto. Običajno nas pri izvajanju poskusov s ponavljajočimi se meritvami zanimajo razlike v meritvah istih količin v različnih časovnih točkah. Zanima nas namreč pomen teh razlik. Če se kospremenljivke merijo hkrati z meritvami odvisne spremenljivke, je mogoče izračunati korelacijo med kospremenljivko in odvisno spremenljivko.

Na primer, zanimanje za matematiko in matematične spretnosti bi lahko raziskali na začetku in koncu semestra. Zanimivo bi bilo preveriti, ali so spremembe v zanimanju za matematiko povezane s spremembami v matematičnih veščinah.

Modul Analiza variance V STATISTICA samodejno oceni statistično pomembnost sprememb kovariatov v načrtih, kjer je to mogoče.

Multivariatne zasnove: multivariatna analiza variance in kovariance

Medskupinski načrti

Vsi prej obravnavani primeri so vključevali samo eno odvisno spremenljivko. Pri večih odvisnih spremenljivkah hkrati se poveča samo kompleksnost izračunov, vsebina in osnovni principi pa se ne spremenijo.

Na primer, študija se izvaja na dveh različnih učbenikih. Hkrati se proučuje uspeh študentov pri študiju fizike in matematike. V tem primeru gre za dve odvisni spremenljivki in ugotoviti morate, kako dva različna učbenika vplivata nanje hkrati. Če želite to narediti, lahko uporabite multivariatno analizo variance (MANOVA). Namesto enodimenzionalnih F uporabljeno večdimenzionalno merilo F test (Wilksov l test), ki temelji na primerjavi matrike kovariance napak in matrike medskupinske kovariance.

Če so odvisne spremenljivke med seboj korelirane, je treba to korelacijo upoštevati pri izračunu kriterija pomembnosti. Očitno je, da če isto meritev ponovimo dvakrat, potem ni mogoče dobiti nič novega. Če se obstoječi dimenziji doda korelirana dimenzija, se pridobi nekaj novih informacij, vendar nova spremenljivka vsebuje odvečne informacije, kar se odraža v kovarianci med spremenljivkama.

Interpretacija rezultatov.Če je splošni multivariatni test pomemben, lahko sklepamo, da je ustrezen učinek (npr. vrsta učbenika) pomemben. Postavljajo pa se naslednja vprašanja. Ali vrsta učbenika vpliva na izboljšanje samo matematičnih spretnosti, samo fizičnih spretnosti ali obeh? Pravzaprav se po pridobitvi pomembnega multivariatnega testa preuči univariatni test za posamezni glavni učinek ali interakcijo. F merilo. Z drugimi besedami, odvisne spremenljivke, ki prispevajo k pomembnosti multivariatnega testa, se preučujejo ločeno.

Načrti ponavljajočih se ukrepov

Če se matematično in fizikalno znanje dijakov meri na začetku in na koncu semestra, gre za ponavljajoča se merjenja. Preučevanje merila pomembnosti v takih načrtih je logičen razvoj enodimenzionalnega primera. Upoštevajte, da se tehnike multivariatne analize variance pogosto uporabljajo tudi za preverjanje pomembnosti faktorjev univariantnih ponovljenih meritev, ki imajo več kot dve ravni. O ustreznih aplikacijah bomo razpravljali kasneje v tem delu.

Seštevek vrednosti spremenljivk in multivariatna analiza variance

Tudi izkušeni uporabniki univariatne in multivariatne analize variance pogosto težko dobijo različne rezultate pri uporabi multivariatne analize variance na primer za tri spremenljivke in pri uporabi univariatne analize variance za vsoto teh treh spremenljivk, kot da bile ena sama spremenljivka.

Ideja seštevanje spremenljivke je, da vsaka spremenljivka vsebuje nekaj prave spremenljivke, ki se preučuje, ter naključno merilno napako. Zato bo pri povprečenju vrednosti spremenljivk merilna napaka bližja 0 za vse meritve in povprečne vrednosti bodo bolj zanesljive. Pravzaprav je v tem primeru uporaba ANOVE za vsoto spremenljivk razumna in močna tehnika. Če pa so odvisne spremenljivke večdimenzionalne narave, je seštevanje vrednosti spremenljivk neprimerno.

Na primer, naj odvisne spremenljivke sestavljajo štirje indikatorji uspeh v družbi. Vsak kazalnik označuje popolnoma neodvisen vidik človekove dejavnosti (na primer poklicni uspeh, uspeh v poslu, družinsko blaginjo itd.). Dodajanje teh spremenljivk je kot dodajanje jabolk in pomaranč. Vsota teh spremenljivk ne bi bila primerna enodimenzionalna mera. Zato je treba takšne podatke obravnavati kot večdimenzionalne kazalnike multivariatna analiza variance.

Analiza kontrasta in post hoc testi

Zakaj se primerjajo ločeni nizi povprečij?

Običajno hipoteze o eksperimentalnih podatkih niso oblikovane le v smislu glavnih učinkov ali interakcij. Primer bi bila tale hipoteza: določen učbenik izboljšuje matematične sposobnosti samo pri moških, medtem ko je drug učbenik približno enako učinkovit za oba spola, vendar je še vedno manj učinkovit za moške. Predvidevamo lahko, da je učinkovitost učbenikov povezana s spolom učencev. Velja pa tudi ta napoved narave interakcije. Pri učencih, ki uporabljajo eno knjigo, se pričakuje pomembna razlika med spoloma, pri študentih, ki uporabljajo drugo knjigo, pa praktično neodvisni rezultati glede na spol. To vrsto hipotez običajno preučujemo s kontrastno analizo.

Analiza kontrastov

Skratka, analiza kontrasta omogoča ovrednotenje statistične pomembnosti določenih linearnih kombinacij kompleksnih učinkov. Kontrastna analiza je glavni in obvezni element vsakega kompleksnega načrta ANOVA. Modul Analiza variance ima precej različnih zmožnosti kontrastne analize, ki vam omogočajo, da izolirate in analizirate katero koli vrsto primerjave povprečij.

A posteriori primerjave

Včasih se kot rezultat obdelave eksperimenta odkrije nepričakovan učinek. Čeprav bo kreativni raziskovalec v večini primerov sposoben razložiti kateri koli rezultat, to ne omogoča nadaljnje analize in ocen za napovedovanje. Ta težava je ena tistih, za katere aposteriorna merila, torej merila, ki ne uporabljajo a priori hipoteze. Za ponazoritev razmislite o naslednjem poskusu. Predpostavimo, da obstaja 100 kartic s številkami od 1 do 10. Če vse te karte damo v glavo, naključno izberemo 5 kartic 20-krat in izračunamo povprečno vrednost (povprečje števil, zapisanih na kartah) za vsak vzorec. Ali lahko pričakujete, da bosta dva vzorca, katerih povprečja se bistveno razlikujeta? To je zelo verjetno! Če izberete dva vzorca z največjim in najmanjšim povprečjem, lahko dobite razliko v povprečjih, ki se zelo razlikuje od razlike v povprečjih, na primer prvih dveh vzorcev. To razliko je mogoče raziskati na primer z analizo kontrasta. Ne da bi se spuščali v podrobnosti, obstaja več t.i a posteriori kriteriji, ki temeljijo natanko na prvem scenariju (jemanje ekstremnih povprečij iz 20 vzorcev), tj. ti kriteriji temeljijo na izbiri najbolj različnih povprečij za primerjavo vseh povprečij v načrtu. Ta merila se uporabljajo za zagotovitev, da umetni učinek ni dosežen čisto po naključju, na primer za zaznavanje pomembne razlike med povprečji, ko je ni. Modul Analiza variance ponuja široko paleto takih meril. Ko se v poskusu, ki vključuje več skupin, pojavijo nepričakovani rezultati a posteriori postopki za preverjanje statistične pomembnosti dobljenih rezultatov.

Vsota kvadratov vrste I, II, III in IV

Multivariatna regresija in analiza variance

Obstaja tesna povezava med metodo multivariatne regresije in analizo variance (analiza variance). Pri obeh metodah se proučuje linearni model. Skratka, skoraj vse eksperimentalne načrte je mogoče pregledati z uporabo multivariatne regresije. Razmislite o naslednji enostavni zasnovi medskupin 2 x 2.

D.V. A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Stolpca A in B vsebujeta kode, ki označujeta ravni faktorjev A in B, stolpec AxB vsebuje produkt dveh stolpcev A in B. Te podatke lahko analiziramo z uporabo multivariatne regresije. Spremenljivka D.V. definirana kot odvisna spremenljivka, spremenljivke od A prej AxB kot neodvisne spremenljivke. Študija pomembnosti za regresijske koeficiente bo sovpadala z izračuni v analizi variance pomembnosti glavnih učinkov dejavnikov A in B in učinek interakcije AxB.

Neuravnoteženi in uravnoteženi načrti

Pri izračunu korelacijske matrike za vse spremenljivke, kot so zgoraj prikazani podatki, boste opazili, da so glavni učinki dejavnikov A in B in učinek interakcije AxB nepovezano. Ta lastnost učinkov se imenuje tudi ortogonalnost. Pravijo, da so učinki A in B - pravokoten oz neodvisen drug od drugega. Če so vsi učinki v načrtu pravokotni drug na drugega, kot v zgornjem primeru, se načrt imenuje uravnoteženo.

Uravnoteženi načrti imajo "dobro lastnost". Izračuni za analizo takih načrtov so zelo preprosti. Vsi izračuni se skrčijo na izračun korelacije med učinki in odvisnimi spremenljivkami. Ker so učinki pravokotni, so delne korelacije (kot v celoti večdimenzionalen regresije) niso izračunane. Vendar v resničnem življenju načrti niso vedno uravnoteženi.

Oglejmo si realne podatke z neenakim številom opazovanj v celicah.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Če te podatke kodiramo kot zgoraj in izračunamo korelacijsko matriko za vse spremenljivke, ugotovimo, da so dejavniki zasnove med seboj korelirani. Faktorji v načrtu niso več ortogonalni in takšni načrti se imenujejo neuravnotežen. Upoštevajte, da je v obravnavanem primeru korelacija med faktorji v celoti posledica razlike v frekvencah 1 in -1 v stolpcih podatkovne matrike. Z drugimi besedami, eksperimentalni načrti z neenakimi volumni celic (natančneje, nesorazmernimi volumni) bodo neuravnoteženi, kar pomeni, da bodo glavni učinki in interakcije zamešani. V tem primeru je treba za izračun statistične pomembnosti učinkov izračunati celotno multivariatno regresijo. Tukaj je več strategij.

Vsota kvadratov vrste I, II, III in IV

Vrsta vsote kvadratovjazinIII. Za preučitev pomembnosti vsakega faktorja v multivariatnem modelu je mogoče izračunati delno korelacijo vsakega faktorja, pod pogojem, da so vsi drugi dejavniki že upoštevani v modelu. Faktorje lahko vnesete tudi v model po korakih, pri čemer zajamete vse faktorje, ki so že vneseni v model, in zanemarite vse druge faktorje. Na splošno je to razlika med vrsta III in vrstajaz vsota kvadratov (to terminologijo je uvedel SAS, glej na primer SAS, 1982; podrobno razpravo je mogoče najti tudi v Searle, 1987, str. 461; Woodward, Bonett in Brecht, 1990, str. 216; ali Milliken in Johnson, 1984, str.

Vrsta vsote kvadratovII. Naslednja »vmesna« strategija oblikovanja modela je sestavljena iz: nadzora vseh glavnih učinkov pri preučevanju pomembnosti posameznega glavnega učinka; pri nadzoru vseh glavnih učinkov in vseh interakcij v parih pri preučevanju pomembnosti posamezne interakcije v parih; pri nadzoru vseh glavnih učinkov vseh parnih interakcij in vseh interakcij treh dejavnikov; pri preučevanju posamezne interakcije treh dejavnikov itd. Vsote kvadratov za tako izračunane učinke imenujemo vrstaII vsota kvadratov. Torej, vrstaII vsota kvadratov nadzoruje vse učinke istega reda in nižjega reda, medtem ko ignorira vse učinke višjega reda.

Vrsta vsote kvadratovIV. Končno je za nekatere posebne načrte z manjkajočimi celicami (nepopolni načrti) mogoče izračunati t.i. vrsta IV vsota kvadratov. O tej metodi bomo razpravljali kasneje v povezavi z nepopolnimi zasnovami (zasnovi z manjkajočimi celicami).

Interpretacija hipoteze vsote kvadratov tipov I, II in III

Vsota kvadratov vrstaIII najlažje interpretirati. Spomnimo se, da so vsote kvadratov vrstaIII preuči učinke po nadzoru vseh drugih učinkov. Na primer po ugotovitvi statistično pomembnega vrstaIII učinek za faktor A v modulu Analiza variance, lahko rečemo, da obstaja en sam pomemben učinek dejavnika A, po uvedbi vseh ostalih učinkov (faktorjev) in ta učinek ustrezno interpretirati. V verjetno 99 % vseh aplikacij ANOVA je to vrsta testa, ki raziskovalca zanima. Ta vrsta vsote kvadratov se običajno izračuna po modulu Analiza variance privzeto, ne glede na to, ali je možnost izbrana Regresijski pristop ali ne (standardni pristopi, sprejeti v modulu Analiza variance obravnavano spodaj).

Pomembni učinki, dobljeni z uporabo vsot kvadratov vrsta oz vrstaII vsot kvadratov ni tako enostavno interpretirati. Najbolje jih je razlagati v kontekstu postopne multivariatne regresije. Če pri uporabi vsote kvadratov vrstajaz glavni učinek faktorja B je bil pomemben (po tem, ko je bil faktor A vključen v model, vendar preden je bila dodana interakcija med A in B), lahko sklepamo, da obstaja pomemben glavni učinek faktorja B, če ni interakcije med faktorjema A in B. (Če uporabljate merilo vrstaIII, se je tudi faktor B izkazal za pomembnega, potem lahko sklepamo, da obstaja pomemben glavni učinek faktorja B, potem ko smo v model vnesli vse druge dejavnike in njihove interakcije).

V smislu hipoteze mejnih sredstev vrstajaz in vrstaII običajno nimajo preproste razlage. V teh primerih velja, da pomena učinkov ni mogoče razlagati samo z obrobnimi sredstvi. Raje predstavljeno str povprečja so povezana s kompleksno hipotezo, ki združuje povprečja in velikost vzorca. na primer vrstaII hipoteze za faktor A v preprostem primeru načrta 2 x 2, o katerem smo govorili prej, bi bile (glej Woodward, Bonett in Brecht, 1990, str. 219):

nij- število opazovanj v celici

uij- povprečna vrednost v celici

n. j- mejno povprečje

Ne da bi se spuščali v podrobnosti (za več podrobnosti glej Milliken in Johnson, 1984, 10. poglavje), je jasno, da ne gre za enostavne hipoteze in v večini primerov nobena od njih ni posebej zanimiva za raziskovalca. Vendar pa obstajajo primeri, ko hipoteze vrstajaz je lahko zanimivo.

Privzeti računski pristop v modulu Analiza variance

Privzeto, če možnost ni potrjena Regresijski pristop, modul Analiza variance uporablja celični povprečni model. Za ta model je značilno, da se vsote kvadratov za različne učinke izračunajo za linearne kombinacije srednjih vrednosti celic. V polnem faktorskem poskusu to povzroči vsote kvadratov, ki so enake vsotam kvadratov, o katerih smo govorili prej kot vrsta III. Vendar pa v možnosti Načrtovane primerjave(v oknu Rezultati ANOVA), lahko uporabnik preizkusi hipotezo glede na katero koli linearno kombinacijo uteženih ali neuteženih srednjih vrednosti celic. Tako lahko uporabnik preizkusi ne le hipoteze vrstaIII, ampak hipoteze katere koli vrste (vključno vrstaIV). Ta splošni pristop je še posebej uporaben pri preučevanju načrtov z manjkajočimi celicami (imenovanih nepopolni načrti).

Za popolne faktorske načrte je ta pristop uporaben tudi, ko želimo analizirati utežene mejne sredine. Na primer, predpostavimo, da moramo v preprosti zasnovi 2 x 2, ki smo jo obravnavali prej, primerjati utežene (po ravneh faktorjev) B) mejna povprečja za faktor A. To je uporabno, kadar distribucije opazovanj po celicah ni pripravil eksperimentator, ampak je bila konstruirana naključno, in ta naključnost se odraža v porazdelitvi števila opazovanj po ravneh faktorja B v agregat.

Na primer, obstaja dejavnik - starost vdov. Možni vzorec anketiranih je razdeljen na dve skupini: mlajši od 40 let in starejši od 40 let (faktor B). Drugi dejavnik (faktor A) v načrtu je bil, ali so vdove prejele socialno podporo neke agencije (nekatere vdove so bile naključno izbrane, druge so služile kot kontrola). V tem primeru porazdelitev vdov po starosti v vzorcu odraža dejansko porazdelitev vdov po starosti v populaciji. Ocena učinkovitosti skupine za socialno pomoč vdovam vse starosti bo ustrezalo tehtanemu povprečju za dve starostni skupini (z utežmi, ki ustrezajo številu opazovanj v skupini).

Načrtovane primerjave

Upoštevajte, da vsota vnesenih kontrastnih koeficientov ni nujno enaka 0 (nič). Namesto tega bo program samodejno izvedel prilagoditve, da zagotovi, da se ustrezne hipoteze ne zamenjajo s skupnim povprečjem.

Za ponazoritev tega se vrnimo k preprostemu načrtu 2 x 2, o katerem smo govorili prej. Spomnimo se, da je število opazovanj v celicah te neuravnotežene zasnove -1, 2, 3 in 1. Recimo, da želimo primerjati utežene mejne srednje vrednosti za faktor A (utežene s frekvenco ravni faktorja B). Vnesete lahko kontrastne koeficiente:

Upoštevajte, da seštevek teh koeficientov ne znaša 0. Program bo nastavil koeficiente tako, da bodo seštevek znašali 0, njihove relativne vrednosti pa bodo ohranjene, tj.:

1/3 2/3 -3/4 -1/4

Ti kontrasti bodo primerjali utežene srednje vrednosti za faktor A.

Hipoteze o glavnem povprečju. Hipotezo, da je neutežena glavna sredina 0, je mogoče raziskati z uporabo koeficientov:

Hipotezo, da je tehtano glavno povprečje 0, testiramo z:

V nobenem primeru program ne prilagodi kontrastnih razmerij.

Analiza načrtov z manjkajočimi celicami (nepopolni načrti)

Faktorske zasnove, ki vsebujejo prazne celice (kombinacije celic, ki nimajo opazovanj), imenujemo nepopolne. V takšnih zasnovah nekateri dejavniki običajno niso pravokotni in nekaterih interakcij ni mogoče izračunati. Na splošno ni boljše metode za analizo takih načrtov.

Regresijski pristop

V nekaterih starejših programih, ki temeljijo na analizi modelov ANOVA z uporabo multivariatne regresije, so faktorji v nepopolnih načrtih podani privzeto kot običajno (kot da bi bil načrt popoln). Na teh navideznih kodiranih faktorjih se nato izvedejo multivariatne regresijske analize. Na žalost ta metoda daje rezultate, ki jih je zelo težko, če ne nemogoče, interpretirati, ker ni jasno, kako vsak učinek prispeva k linearni kombinaciji sredstev. Razmislite o naslednjem preprostem primeru.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 zgrešeno

Če izvedemo multivariatno regresijo obrazca Odvisna spremenljivka = konstanta + faktor A + faktor B, potem je hipoteza o pomembnosti faktorjev A in B v smislu linearnih kombinacij povprečij videti takole:

Faktor A: celica A1,B1 = celica A2,B1

Faktor B: celica A1,B1 = celica A1,B2

Ta primer je preprost. Pri kompleksnejših zasnovah je nemogoče dejansko določiti, kaj točno bo pregledano.

Celična sredstva, pristop ANOVA , hipoteze tipa IV

Pristop, ki je priporočen v literaturi in se zdi bolj priporočljiv, je preučevanje smiselnega (v smislu raziskovalnih vprašanj) a priori hipoteze o sredstvih, opaženih v celicah načrta. Podrobno razpravo o tem pristopu je mogoče najti v Dodge (1985), Heiberger (1989), Milliken in Johnson (1984), Searle (1987) ali Woodward, Bonett in Brecht (1990). Vsote kvadratov, povezane s hipotezami o linearni kombinaciji srednjih vrednosti v nepopolnih načrtih, ki preučujejo ocene dela učinkov, se imenujejo tudi vsote kvadratov IV.

Samodejno ustvarjanje tipskih hipotezIV. Kadar imajo multivariatne zasnove zapletene vzorce manjkajočih celic, je zaželeno opredeliti ortogonalne (neodvisne) hipoteze, katerih preučevanje je enakovredno preučevanju glavnih učinkov ali interakcij. Za ustvarjanje ustreznih uteži za takšne primerjave so bile razvite algoritemske (računalniške) strategije (ki temeljijo na psevdoinverzni načrtovalski matriki). Na žalost končne hipoteze niso definirane na edinstven način. Seveda so odvisni od vrstnega reda, v katerem so bili učinki identificirani, in le redko omogočajo preprosto razlago. Zato je priporočljivo natančno preučiti naravo manjkajočih celic in nato oblikovati hipoteze vrstaIV, ki najbolj smiselno ustrezajo ciljem študije. Nato raziščite te hipoteze z možnostjo Načrtovane primerjave v oknu rezultate. Primerjave v tem primeru najlažje določimo tako, da zahtevamo uvedbo vektorja kontrastov za vse dejavnike. skupaj v oknu Načrtovane primerjave. Po klicu pogovornega okna Načrtovane primerjave Prikazane bodo vse skupine v trenutnem načrtu, tiste, ki manjkajo, pa bodo označene.

Manjkajoče celice in testiranje specifičnega učinka

Obstaja več vrst načrtov, pri katerih lokacija manjkajočih celic ni naključna, ampak je skrbno načrtovana, kar omogoča preprosto analizo glavnih učinkov brez vpliva na druge učinke. Na primer, ko zahtevano število celic v načrtu ni na voljo, se pogosto uporabljajo načrti latinski kvadrati oceniti glavne učinke več dejavnikov z velikim številom ravni. Na primer, faktorski načrt 4 x 4 x 4 x 4 zahteva 256 celic. Hkrati lahko uporabite Grško-latinski trg za oceno glavnih učinkov s samo 16 celicami v načrtu (pogl Načrtovanje eksperimenta, zvezek IV, vsebuje podroben opis takih načrtov). Nepopolne zasnove, pri katerih je glavne učinke (in nekatere interakcije) mogoče oceniti z uporabo preprostih linearnih kombinacij sredstev, imenujemo uravnoteženi nepopolni načrti.

V uravnoteženih zasnovah bo standardna (privzeta) metoda generiranja kontrastov (uteži) za glavne učinke in interakcije nato ustvarila tabelo analize varianc, v kateri vsote kvadratov za zadevne učinke med seboj niso pomešane. Možnost Specifični učinki okno rezultate bo ustvaril manjkajoče kontraste tako, da bo v manjkajoče celice načrta napisal ničlo. Takoj po tem, ko je zahtevana možnost Specifični učinki za uporabnika, ki preučuje neko hipotezo, se prikaže tabela rezultatov z dejanskimi utežmi. Upoštevajte, da se v uravnoteženi zasnovi vsote kvadratov ustreznih učinkov izračunajo le, če so ti učinki pravokotni (neodvisni) od vseh drugih glavnih učinkov in interakcij. V nasprotnem primeru morate uporabiti možnost Načrtovane primerjave raziskati smiselne primerjave med sredstvi.

Manjkajoče celice in združeni učinki/izrazi napak

Če možnost Regresijski pristop na začetni plošči modula Analiza variance ni izbran, bo pri izračunu vsote kvadratov za učinke uporabljen celični povprečni model (privzeta nastavitev). Če zasnova ni uravnotežena, potem pri kombiniranju neortogonalnih učinkov (glejte zgornjo razpravo o možnosti Zamujene celice in specifičen učinek) lahko dobimo vsoto kvadratov, sestavljenih iz neortogonalnih (ali prekrivajočih se) komponent. Dobljenih rezultatov običajno ni mogoče interpretirati. Zato je treba biti zelo previden pri izbiri in izvajanju zapletenih nepopolnih eksperimentalnih načrtov.

Obstaja veliko knjig s podrobnimi razpravami o različnih vrstah načrtov. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken in Johnson, 1984; Searle, 1987; Woodward in Bonett, 1990), vendar tovrstne informacije presegajo obseg tega učbenika. Vendar pa bo analiza različnih vrst načrtov prikazana kasneje v tem razdelku.

Predpostavke in učinki kršitve predpostavk

Odstopanje od predpostavke normalnih porazdelitev

Recimo, da je odvisna spremenljivka izmerjena na numerični lestvici. Predpostavimo tudi, da je odvisna spremenljivka normalno porazdeljena znotraj vsake skupine. Analiza variance vsebuje široko paleto grafov in statističnih podatkov, ki podpirajo to predpostavko.

Učinki motenj. Nasploh F test je zelo robusten do odstopanj od normalnosti (za podrobne rezultate glej Lindman, 1974). Če je kurtosis večji od 0, je vrednost statistike enaka F lahko postanejo zelo majhne. Ničelna hipoteza je sprejeta, čeprav morda ni resnična. Situacija je obrnjena, ko je kurtoza manjša od 0. Asimetrija porazdelitve običajno malo vpliva na F statistika. Če je število opazovanj v celici dovolj veliko, potem odstopanje od normalnosti ni posebej pomembno zaradi centralni mejni izrek, po katerem je porazdelitev povprečne vrednosti blizu normalne, ne glede na začetno porazdelitev. Podrobna razprava o trajnosti F statistike lahko najdete pri Box in Anderson (1955) ali Lindman (1974).

Izenačenost variance

Predpostavke. Predpostavlja se, da so variance različnih oblikovalskih skupin enake. Ta predpostavka se imenuje predpostavka homogenost variance. Spomnimo se, da smo na začetku tega razdelka pri opisu izračuna vsote kvadratov napak izvedli seštevanje znotraj posamezne skupine. Če se variance v dveh skupinah med seboj razlikujejo, potem njihovo seštevanje ni zelo naravno in ne zagotavlja ocene celotne variance znotraj skupine (ker v tem primeru skupne variance sploh ni). Modul Analiza variance -ANOVA/MANOVA vsebuje velik nabor statističnih kriterijev za odkrivanje odstopanj od predpostavk o homogenosti variance.

Učinki motenj. Lindman (1974, str. 33) to pokaže F kriterij je precej stabilen glede na kršitev predpostavk o homogenosti variance ( heterogenost varianca, glej tudi Box, 1954a, 1954b; Hsu, 1938).

Poseben primer: korelacija povprečij in varianc. So časi, ko F statistika lahko zavajati. To se zgodi, ko so sredstva načrtovalskih celic povezana z varianco. Modul Analiza variance vam omogoča, da narišete diagrame razpršitve variance ali standardnega odklona glede na srednjo vrednost, da zaznate takšno korelacijo. Razlog, zakaj je ta korelacija nevarna, je naslednji. Predstavljajmo si, da je v načrtu 8 celic, od katerih jih ima 7 skoraj enako povprečje, v eni celici pa je povprečje precej višje od ostalih. Potem F test lahko zazna statistično pomemben učinek. Toda predpostavimo, da je v celici z veliko povprečno vrednostjo varianca znatno večja od drugih, tj. povprečna vrednost in varianca v celicah sta odvisni (višje kot je povprečje, večja je varianca). V tem primeru je veliko povprečje nezanesljivo, ker je lahko posledica velikih odstopanj v podatkih. Vendar F statistika na podlagi združeni varianca znotraj celic bo zajela veliko povprečje, čeprav testi, ki temeljijo na varianci znotraj vsake celice, ne bodo upoštevali vseh razlik v povprečjih kot pomembne.

Ta vrsta podatkov (velika povprečna vrednost in velika varianca) se pogosto pojavi, ko obstajajo izstopajoča opazovanja. Eno ali dve izstopajoči opazki močno premakneta povprečje in močno povečata varianco.

Homogenost variance in kovariance

Predpostavke. Multivariatne zasnove z večvariantnimi odvisnimi merami prav tako uporabljajo prej opisano predpostavko o homogenosti variance. Ker pa obstajajo večvariatne odvisne spremenljivke, je potrebno tudi, da so njihove navzkrižne korelacije (kovariance) enotne v vseh celicah zasnove. Modul Analiza variance ponuja različne načine za testiranje teh predpostavk.

Učinki motenj. Večdimenzionalni analog F- kriterij - Wilksov λ-test. O robustnosti Wilksovega λ testa glede kršitev zgornjih predpostavk ni veliko znanega. Ker pa razlaga rezultatov modula Analiza variance običajno temelji na pomembnosti univariantnih učinkov (po ugotovitvi pomembnosti splošnega kriterija), razprava o robustnosti zadeva predvsem univariatno analizo variance. Zato je treba skrbno preučiti pomen univariantnih učinkov.

Poseben primer: analiza kovariance. Posebej resne kršitve homogenosti variance/kovariance se lahko pojavijo, če so v načrt vključene kosvariate. Zlasti, če se korelacija med kospremenljivkami in odvisnimi merami razlikuje med celicami v načrtu, lahko pride do napačne interpretacije rezultatov. Ne pozabite, da analiza kovariance v bistvu izvede regresijsko analizo znotraj vsake celice, da izolira tisti del variance, ki ga predstavlja kovarianca. Predpostavka o homogenosti variance/kovariance predpostavlja, da se ta regresijska analiza izvaja pod naslednjo omejitvijo: vse regresijske enačbe (nakloni) za vse celice so enake. Če tega ne predvidevamo, se lahko pojavijo velike napake. Modul Analiza variance ima več posebnih meril za preverjanje te predpostavke. Priporočljivo je, da uporabite ta merila, da zagotovite, da so regresijske enačbe za različne celice približno enake.

Sferičnost in kompleksna simetrija: razlogi za uporabo multivariantnega pristopa k ponavljajočim se meram pri analizi variance

Pri načrtih, ki vsebujejo faktorje ponavljajočih se meritev z več kot dvema nivojema, uporaba univariatne ANOVE zahteva dodatne predpostavke: predpostavko sestavljene simetrije in predpostavko sferičnosti. Te predpostavke so redko izpolnjene (glejte spodaj). Zato je v zadnjih letih multivariatna analiza variance postala priljubljena pri takšnih načrtih (oba pristopa sta združena v modulu Analiza variance).

Predpostavka kompleksne simetrije Predpostavka sestavljene simetrije je, da so variance (deljene znotraj skupin) in kovariance (deljene znotraj skupin) za različne ponavljajoče se mere homogene (enake). To je zadosten pogoj, da je univariatni test F za ponavljajoče se meritve veljaven (tj. sporočene vrednosti F so v povprečju skladne s porazdelitvijo F). Vendar v tem primeru ta pogoj ni potreben.

Predpostavka o sferičnosti. Predpostavka o sferičnosti je nujen in zadosten pogoj, da je F-test veljaven. Sestoji iz dejstva, da so znotraj skupin vsa opazovanja neodvisna in enakomerno porazdeljena. Narava teh predpostavk in vpliv njihovega kršenja običajno nista dobro opisana v knjigah o ANOVI – to bo obravnavano v naslednjih odstavkih. Pokazalo se bo tudi, da se lahko rezultati univariatnega pristopa razlikujejo od rezultatov multivariatnega pristopa, in razloženo bo, kaj to pomeni.

Potreba po neodvisnosti hipotez. Splošni način analize podatkov v ANOVA je prileganje modela. Če je glede na model, ki ustreza podatkom, nekaj a priori hipotez, potem se varianca razdeli za testiranje teh hipotez (merila za glavne učinke, interakcije). Z računalniškega vidika ta pristop generira niz kontrastov (niz primerjav povprečij načrta). Če pa kontrasti niso neodvisni drug od drugega, postane delitev varianc nesmiselna. Na primer, če sta dva kontrasta A in B sta enaka in se izloči ustrezni del variance, potem se isti del izlušči dvakrat. Na primer, neumno in nesmiselno je identificirati dve hipotezi: "povprečje v celici 1 je višje od povprečja v celici 2" in "povprečje v celici 1 je višje od povprečja v celici 2." Torej morajo biti hipoteze neodvisne ali ortogonalne.

Neodvisne hipoteze v ponovljenih meritvah. Splošni algoritem implementiran v modulu Analiza variance, bo poskušal ustvariti neodvisne (ortogonalne) kontraste za vsak učinek. Za faktor ponavljajočih se meritev ti kontrasti ponujajo številne hipoteze v zvezi razlike med ravnmi obravnavanega dejavnika. Če pa so te razlike povezane znotraj skupin, potem nastali kontrasti niso več neodvisni. Na primer pri poučevanju, kjer se študenti merijo trikrat v enem semestru, se lahko zgodi, da je sprememba med 1. in 2. meritvijo negativno povezana s spremembo med 2. in 3. meritvijo predmetov. Tisti, ki obvladajo večino snovi med 1. in 2. dimenzijo, obvladajo manjši del v času, ki je pretekel med 2. in 3. dimenzijo. Pravzaprav se za večino primerov, kjer se ANOVA uporablja za ponavljajoče se meritve, lahko domneva, da so spremembe med ravnmi povezane med osebami. Vendar ko se to zgodi, predpostavka o kompleksni simetriji in predpostavka o sferičnosti ne držita in neodvisnih kontrastov ni mogoče izračunati.

Vpliv kršitev in načini njihove odprave.Če predpostavke o kompleksni simetriji ali sferičnosti niso izpolnjene, lahko ANOVA povzroči napačne rezultate. Preden so bili multivariatni postopki dovolj razviti, je bilo predlaganih več predpostavk za nadomestilo kršitev teh predpostavk. (Glej na primer Greenhouse & Geisser, 1959 in Huynh & Feldt, 1970). Te metode se še vedno pogosto uporabljajo (zato so predstavljene v modulu Analiza variance).

Pristop multivariatne analize variance k ponavljajočim se meritvam. Na splošno se problemi kompleksne simetrije in sferičnosti nanašajo na dejstvo, da nizi kontrastov, vključeni v študijo učinkov ponavljajočih se merilnih dejavnikov (z več kot 2 nivojema), niso neodvisni drug od drugega. Vendar ni treba, da so neodvisni, če se uporabljajo večdimenzionalen test za hkratno testiranje statistične pomembnosti dveh ali več ponovljenih meritev faktorskih kontrastov. To je razlog, zakaj so se tehnike multivariatne analize variance vse pogosteje uporabljale za testiranje pomembnosti univariantnih faktorjev ponovljenih meritev z več kot 2 nivojema. Ta pristop je splošno sprejet, ker na splošno ne zahteva kompleksne simetrije ali sferičnosti.

Primeri, v katerih ni mogoče uporabiti pristopa multivariatne analize variance. Obstajajo primeri (načrti), kjer pristopa multivariatne analize variance ni mogoče uporabiti. To so tipični primeri, ko je v zasnovi majhno število predmetov in veliko ravni v faktorju ponavljajočih se meritev. Potem bo morda premalo opazovanj za izvedbo multivariatne analize. Če je na primer 12 predmetov, str = 4 faktor ponavljajočih se meritev in vsak faktor ima k = 3 stopnje. Potem bo interakcija 4 dejavnikov "porabljala" (k-1) str = 2 4 = 16 stopnje svobode. Vendar pa obstaja samo 12 predmetov, zato multivariantnega testa v tem primeru ni mogoče izvesti. Modul Analiza variance bo neodvisno zaznal ta opažanja in izračunal le enodimenzionalna merila.

Razlike v univariatnih in multivariatnih rezultatih.Če študija vključuje veliko število ponovljenih meritev, lahko pride do primerov, ko pristop ANOVA z univariantnimi ponovljenimi meritvami daje rezultate, ki se zelo razlikujejo od tistih, pridobljenih z multivariatnim pristopom. To pomeni, da so razlike med ravnmi ustreznih ponavljajočih se meritev povezane med predmeti. Včasih je to dejstvo neodvisnega pomena.

Multivariatna analiza variance in modeliranje strukturnih enačb

V zadnjih letih je modeliranje strukturnih enačb postalo priljubljeno kot alternativa multivariatni analizi variance (glej na primer Bagozzi in Yi, 1989; Bagozzi, Yi in Singh, 1991; Cole, Maxwell, Arvey in Salas, 1993) . Ta pristop omogoča testiranje hipotez ne le o povprečjih v različnih skupinah, temveč tudi o korelacijskih matrikah odvisnih spremenljivk. Na primer, lahko bi omilili predpostavke o homogenosti varianc in kovarianc ter izrecno vključili variance napak in kovariance v model za vsako skupino. Modul STATISTICAModeliranje strukturnih enačb (SEPATH) (glej zvezek III) omogoča tako analizo.

Uporaba statistike v tej opombi bo ponazorjena z medsektorskim primerom. Recimo, da ste vodja proizvodnje pri Perfect Parachute. Padala so izdelana iz sintetičnih vlaken, ki jih dobavljajo štirje različni dobavitelji. Ena glavnih lastnosti padala je njegova moč. Zagotoviti morate, da so vsa dobavljena vlakna enake trdnosti. Da bi odgovorili na to vprašanje, je treba oblikovati eksperimentalno zasnovo za merjenje trdnosti padal, tkanih iz sintetičnih vlaken različnih dobaviteljev. Podatki, pridobljeni s tem poskusom, bodo odločili, kateri dobavitelj zagotavlja najbolj vzdržljiva padala.

Številne aplikacije vključujejo eksperimente, ki upoštevajo več skupin ali ravni enega faktorja. Nekateri dejavniki, kot je temperatura žganja keramike, imajo lahko več številčnih ravni (tj. 300°, 350°, 400° in 450°). Drugi dejavniki, kot je lokacija artiklov v supermarketu, imajo lahko kategorične ravni (npr. prvi dobavitelj, drugi dobavitelj, tretji dobavitelj, četrti dobavitelj). Enofaktorski poskusi, pri katerih so eksperimentalne enote naključno dodeljene skupinam ali faktorskim nivojem, se imenujejo popolnoma randomizirani.

UporabaF-merila za ocenjevanje razlik med več matematičnimi pričakovanji

Če so numerične meritve faktorja v skupinah zvezne in so izpolnjeni nekateri dodatni pogoji, se za primerjavo matematičnih pričakovanj več skupin uporabi analiza variance (ANOVA). An analiza o f Va riance). Analiza variance z uporabo popolnoma randomiziranih modelov se imenuje enosmerni postopek ANOVA. Na nek način je izraz analiza variance napačen, ker primerja razlike med pričakovanimi vrednostmi skupin in ne med variancami. Vendar se primerjava matematičnih pričakovanj izvaja ravno na podlagi analize variacije podatkov. V postopku ANOVA je skupna variacija rezultatov meritev razdeljena na med skupinami in znotraj skupin (slika 1). Znotraj skupinske variacije se pojasni z eksperimentalno napako, variacije med skupinami pa z učinki eksperimentalnih pogojev. Simbol z označuje število skupin.

riž. 1. Variacije razdelitve v popolnoma naključnem poskusu

Prenesite opombo v ali obliki, primeri v obliki

Pretvarjajmo se, da z skupine so izvlečene iz neodvisnih populacij, ki imajo normalno porazdelitev in enako varianco. Ničelna hipoteza je, da so matematična pričakovanja populacij enaka: H 0: μ 1 = μ 2 = ... = μ s. Alternativna hipoteza pravi, da niso vsa matematična pričakovanja enaka: H 1: niso vsi μ j enaki j= 1, 2, …, s).

Na sl. Slika 2 predstavlja resnično ničelno hipotezo o matematičnih pričakovanjih petih primerjanih skupin, pod pogojem, da imajo populacije normalno porazdelitev in enako varianco. Pet populacij, povezanih z različnimi ravnmi faktorja, je identičnih. Posledično se medsebojno prekrivajo in imajo enako matematično pričakovanje, variacijo in obliko.

riž. 2. Pet splošnih populacij ima enako matematično pričakovanje: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

Po drugi strani pa predpostavimo, da je ničelna hipoteza v resnici napačna, pri čemer ima četrta raven najvišjo pričakovano vrednost, prva raven nekoliko nižjo pričakovano vrednost, preostale ravni pa imajo enake ali celo nižje pričakovane vrednosti ( Slika 3). Upoštevajte, da je z izjemo pričakovanih vrednosti vseh pet populacij identičnih (to pomeni, da imajo enako variabilnost in obliko).

riž. 3. Opazen je učinek eksperimentalnih pogojev: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

Pri testiranju hipoteze o enakosti matematičnih pričakovanj več splošnih populacij celotno variacijo razdelimo na dva dela: medskupinsko variacijo zaradi razlik med skupinami in znotrajskupinsko variacijo zaradi razlik med elementi, ki pripadajo isti skupini. Celotna variacija je izražena s skupno vsoto kvadratov (SST – sum of squares total). Ker je nična hipoteza, da so matematična pričakovanja vseh z skupine med seboj enake, je skupna variacija enaka vsoti kvadratov razlik med posameznimi opazovanji in skupnim povprečjem (povprečjem povprečij), izračunanim za vse vzorce. Popolna različica:

Kje - generalna havarija, X ij - jaz-e opazovanje v j- skupina ali nivo, n j- število opazovanj v j skupina, n- skupno število opazovanj v vseh skupinah (tj. n = n 1 + n 2 + … + n c), z- število preučevanih skupin ali ravni.

Variacije med skupinami, običajno imenovana vsota kvadratov med skupinami (SSA – sum of squares among groups), je enaka vsoti kvadratov razlik med vzorčnim povprečjem vsake skupine j in skupno povprečje , pomnoženo z volumnom ustrezne skupine n j:

Kje z- število preučevanih skupin ali ravni, n j- število opazovanj v j skupina, j- Povprečna vrednost j skupina, - skupno povprečje.

Znotraj skupine, običajno imenovana znotrajskupinska vsota kvadratov (SSW - sum of squares withing groups), je enaka vsoti kvadratov razlik med elementi vsake skupine in vzorčno sredino te skupine j:

Kje Xij - jaz th element j skupina, j- Povprečna vrednost j th skupina.

Ker se primerjajo z ravni faktorjev, medskupinska vsota kvadratov ima s – 1 stopnje svobode. Vsak od z ravni ima n j – 1 prostostnih stopenj, zato ima znotrajskupinska vsota kvadratov n- Z prostostne stopnje in

Poleg tega ima skupna vsota kvadratov n – 1 prostostnih stopenj, od vsakega opazovanja Xij se primerja s skupnim povprečjem, izračunanim za vse n opazovanja. Če vsako od teh vsot delimo z ustreznim številom prostostnih stopenj, nastanejo tri vrste disperzije: medskupina(srednji kvadrat med - MSA), znotraj skupine(povprečni kvadrat znotraj - MSW) in poln(povprečna kvadratna vsota - MST):

Kljub temu, da je glavni namen analize variance primerjava matematičnih pričakovanj z skupine, da bi ugotovili učinek eksperimentalnih pogojev, je njegovo ime posledica dejstva, da je glavno orodje analiza varianc različnih vrst. Če je ničelna hipoteza resnična, in med matematičnimi pričakovanji z skupine ni pomembnih razlik, vse tri variance - MSA, MSW in MST - so ocene variance σ 2 neločljivo povezana z analiziranimi podatki. Torej, za testiranje ničelne hipoteze H 0: μ 1 = μ 2 = ... = μ s in alternativna hipoteza H 1: niso vsi μ j enaki j = 1, 2, …, z), potrebno je izračunati statistiko F-merilo, ki je razmerje dveh varianc, MSA in MSW. Test F-statistika pri enosmerni analizi variance

Statistika F- glede na merila F-distribucija z s – 1 prostostne stopnje v števcu M.S.A. in n – s prostostne stopnje v imenovalcu M.S.W.. Za dano stopnjo pomembnosti α se ničelna hipoteza zavrne, če je izračunana F FU, inherentno F-distribucija z s – 1 n – s prostostne stopnje v imenovalcu. Tako, kot je prikazano na sl. 4 je pravilo odločitve formulirano takole: ničelna hipoteza H 0 zavrnjen, če F>FU; drugače se ne zavrne.

riž. 4. Kritično področje analize variance pri testiranju hipoteze H 0

Če je nična hipoteza H 0 je res, izračunano F-statistika je blizu 1, saj sta njen števec in imenovalec oceni iste količine - disperzije σ 2, ki je lastna analiziranim podatkom. Če je nična hipoteza H 0 je napačen (in obstaja pomembna razlika med matematičnimi pričakovanji različnih skupin), izračunan F-statistika bo veliko večja od ena, ker njen števec, MSA, poleg naravne variabilnosti podatkov ocenjuje učinek eksperimentalnih pogojev ali razlike med skupinami, medtem ko imenovalec MSW ocenjuje le naravno variabilnost podatkov . Tako je postopek ANOVA F-merilo, pri katerem se pri dani stopnji pomembnosti α ničelna hipoteza zavrne, če izračunana F-statistični podatki so večji od zgornje kritične vrednosti FU, inherentno F-distribucija z s – 1 prostostne stopnje v števcu in n – s prostostne stopnje v imenovalcu, kot je prikazano na sl. 4.

Za ponazoritev enosmerne analize variance se vrnimo k scenariju, ki je opisan na začetku opombe. Namen poskusa je ugotoviti, ali imajo padala, stkana iz sintetičnih vlaken, pridobljenih od različnih dobaviteljev, enako trdnost. Vsaka skupina ima pet padal. Skupine so razdeljene po dobaviteljih - Dobavitelj 1, Dobavitelj 2, Dobavitelj 3 in Dobavitelj 4. Trdnost padal merimo s posebno napravo, ki preizkuša blago na trganje na obeh straneh. Sila, potrebna za zlom padala, se meri na posebni lestvici. Večja ko je pretrgalna sila, močnejše je padalo. Excel vam omogoča analizo F-statistika z enim klikom. Pojdite skozi meni podatkiAnaliza podatkov in izberite vrstico Enosmerna ANOVA, izpolnite okno, ki se odpre (slika 5). Eksperimentalni rezultati (tržna trdnost), nekaj opisnih statistik in rezultati enosmerne analize variance so predstavljeni na sl. 6.

riž. 5. Okno Enosmerna analiza paketa analize variance Excel

riž. 6. Indikatorji trdnosti padal, tkanih iz sintetičnih vlaken, pridobljenih od različnih dobaviteljev, opisna statistika in rezultati enosmerne analize variance

Analiza slike 6 kaže, da obstaja določena razlika med vzorčnimi sredinami. Povprečna trdnost vlaken, pridobljenih od prvega dobavitelja, je 19,52, od drugega - 24,26, od tretjega - 22,84 in od četrtega - 21,16. Je ta razlika statistično pomembna? Porazdelitev porušitvene sile je prikazana na razpršenem grafu (slika 7). Jasno kaže razlike tako med skupinami kot znotraj njih. Če bi bila vsaka skupina večja, bi lahko za njihovo analizo uporabili diagram stebla in listov, škatlasto grafiko ali zvonasto grafiko.

riž. 7. Diagram razpršitve trdnosti za padala, tkana iz sintetičnih vlaken, pridobljenih od štirih dobaviteljev.

Ničelna hipoteza navaja, da ni pomembnih razlik med povprečnimi rezultati jakosti: H 0: μ 1 = μ 2 = μ 3 = μ 4. Druga hipoteza je, da obstaja vsaj en dobavitelj, katerega povprečna trdnost vlaken se razlikuje od ostalih: H 1: niso vsi μ j enaki ( j = 1, 2, …, z).

Skupno povprečje (glej sliko 6) = AVERAGE(D12:D15) = 21,945; za določitev lahko izračunate tudi povprečje vseh 20 izvirnih števil: = AVERAGE(A3:D7). Izračunane so vrednosti variance Paket analize in se odražajo v plošči Analiza variance(glej sliko 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (glej stolpec SS mize Analiza variance Slika 6). Povprečja se izračunajo tako, da se te vsote kvadratov delijo z ustreznim številom prostostnih stopinj. Zaradi z= 4, a n= 20, dobimo naslednje vrednosti stopenj svobode; za SSA: s – 1= 3; za SSW: n–c= 16; za SST: n – 1= 19 (glej stolpec df). Tako: MSA = SSA / ( s – 1)= 21,095; MSW = SSW / ( n–c) = 6,094; MST = SST / ( n – 1) = 8,463 (glejte stolpec GOSPA). F-statistika = MSA / MSW = 3,462 (glejte stolpec F).

Zgornja kritična vrednost FU, značilnost F-razdelitev, določena s formulo =F.OBR(0,95;3;16) = 3,239. Parametri funkcije =F.OBR(): α = 0,05, števec ima tri prostostne stopnje, imenovalec pa 16. Tako je izračunana F-statistika enaka 3,462 presega zgornjo kritično vrednost FU= 3,239, je ničelna hipoteza zavrnjena (slika 8).

riž. 8. Kritično območje analize variance pri stopnji pomembnosti 0,05, če ima števec tri prostostne stopnje in imenovalec -16

R- vrednost, tj. verjetnost, da če je ničelna hipoteza resnična F- statistika ni manjša od 3,46, kar je enako 0,041 ali 4,1 % (glej stolpec p-vrednost mize Analiza variance Slika 6). Ker ta vrednost ne presega stopnje pomembnosti α = 5 %, se ničelna hipoteza zavrne. Še več, R-vrednost kaže, da je verjetnost zaznave takšne ali večje razlike med matematičnimi pričakovanji splošnih populacij, če so dejansko enake, enaka 4,1 %.

torej. Med štirimi vzorčnimi sredinami je razlika. Ničelna hipoteza je bila, da so vsa matematična pričakovanja štirih populacij enaka. Pod temi pogoji se merilo skupne variabilnosti (tj. skupne variacije SST) moči vseh padal izračuna s seštevanjem kvadratov razlik med posameznimi opazovanji X ij in skupno povprečje . Celotno variacijo smo nato ločili na dve komponenti (glej sliko 1). Prva komponenta je bila variacija SSA med skupinami, druga pa variacija SSW znotraj skupine.

Kaj pojasnjuje variabilnost podatkov? Z drugimi besedami, zakaj vsa opažanja niso enaka? Eden od razlogov je, da različna podjetja dobavljajo vlakna različnih moči. To deloma pojasnjuje, zakaj imajo skupine različna matematična pričakovanja: močnejši kot so učinki eksperimentalnih pogojev, večja je razlika med matematičnimi pričakovanji skupin. Drugi razlog za variabilnost podatkov je naravna variabilnost katerega koli procesa, v tem primeru proizvodnje padal. Tudi če bi bila vsa vlakna kupljena od istega dobavitelja, njihova trdnost ne bi bila enaka, če bi ostali pogoji enaki. Ker se ta učinek pojavlja znotraj vsake skupine, se imenuje variacija znotraj skupine.

Razlike med vzorčnimi sredinami se imenujejo medskupinska variacija SSA. Del znotrajskupinske variacije je, kot že omenjeno, pojasnjen s pripadnostjo podatkov različnim skupinam. Toda tudi če bi bile skupine popolnoma enake (tj. če bi bila ničelna hipoteza resnična), bi razlike med skupinami še vedno obstajale. Razlog za to je naravna variabilnost postopka izdelave padal. Ker so vzorci različni, se njihova vzorčna povprečja med seboj razlikujejo. Torej, če je ničelna hipoteza resnična, variabilnost med skupinami in znotraj skupine predstavlja oceno variabilnosti populacije. Če je ničelna hipoteza napačna, bo hipoteza med skupinami večja. To dejstvo je tisto, kar je v ozadju F-merila za primerjavo razlik med matematičnimi pričakovanji več skupin.

Po izvedbi enosmerne ANOVE in ugotovitvi pomembne razlike med podjetji ostaja neznanka, kateri dobavitelj se bistveno razlikuje od drugih. Vemo le, da matematična pričakovanja splošne populacije niso enaka. Z drugimi besedami, vsaj eno od matematičnih pričakovanj se bistveno razlikuje od drugih. Če želite ugotoviti, kateri dobavitelj se razlikuje od drugih, lahko uporabite Tukey postopek, z uporabo parnih primerjav med dobavitelji. Ta postopek je razvil John Tukey. Kasneje sta on in K. Kramer neodvisno spremenila ta postopek za situacije, v katerih se velikosti vzorcev med seboj razlikujejo.

Večkratna primerjava: Tukey-Kramerjev postopek

V našem scenariju je bila za primerjavo moči padal uporabljena enosmerna analiza variance. Po ugotovitvi pomembnih razlik med matematičnimi pričakovanji štirih skupin je treba ugotoviti, katere skupine se med seboj razlikujejo. Čeprav obstaja več načinov za rešitev tega problema, bomo opisali le Tukey-Kramerjev postopek večkratne primerjave. Ta metoda je primer post hoc primerjalnih postopkov, ker je hipoteza, ki se testira, oblikovana po analizi podatkov. Tukey-Kramerjev postopek omogoča hkratno primerjavo vseh parov skupin. Na prvi stopnji se izračunajo razlike Xj -Xj, Kje j ≠j, med matematičnimi pričakovanji s(s – 1)/2 skupine. Kritični obseg Tukey-Kramerjev postopek se izračuna po formuli:

Kje Q U- zgornja kritična vrednost distribucije študentskega razpona, ki ima z prostostne stopnje v števcu in n - Z prostostne stopnje v imenovalcu.

Če velikosti vzorcev niso enake, se kritični razpon izračuna za vsak par matematičnih pričakovanj posebej. Na zadnji stopnji vsak od s(s – 1)/2 pare matematičnih pričakovanj primerjamo z ustreznim kritičnim območjem. Elementi para se štejejo za bistveno različne, če je modul razlike | Xj -Xj| med njima presega kritično območje.

Uporabimo Tukey-Kramerjev postopek za problem trdnosti padal. Ker ima padalska družba štiri dobavitelje, je treba preveriti 4(4 – 1)/2 = 6 parov dobaviteljev (slika 9).

riž. 9. Parne primerjave vzorčnih povprečij

Ker imajo vse skupine enako prostornino (tj. vse n j = n j), je dovolj, da izračunate samo eno kritično območje. Če želite to narediti, glede na tabelo ANOVA(slika 6) določimo vrednost MSW = 6,094. Nato najdemo vrednost Q U pri α = 0,05, z= 4 (število prostostnih stopinj v števcu) in n- Z= 20 – 4 = 16 (število prostostnih stopinj v imenovalcu). Žal ustrezne funkcije v Excelu nisem našel, zato sem uporabil tabelo (slika 10).

riž. 10. Kritična vrednost študentskega razpona Q U

Dobimo:

Ker je le 4,74 > 4,47 (glej spodnjo tabelo na sliki 9), obstaja statistično pomembna razlika med prvim in drugim dobaviteljem. Vsi drugi pari imajo vzorčna sredstva, ki nam ne dovoljujejo govoriti o njihovih razlikah. Posledično je povprečna trdnost padal, stkanih iz vlaken, kupljenih pri prvem dobavitelju, bistveno manjša kot pri drugem.

Nujni pogoji za enosmerno analizo variance

Pri reševanju problema trdnosti padal nismo preverjali, ali so izpolnjeni pogoji, pod katerimi je možna uporaba enofaktorskega F-merilo. Kako veste, ali lahko uporabite enofaktor F-merilo pri analizi specifičnih eksperimentalnih podatkov? En faktor F-merilo je mogoče uporabiti le, če so izpolnjene tri osnovne predpostavke: eksperimentalni podatki morajo biti naključni in neodvisni, imeti morajo normalno porazdelitev in njihove variance morajo biti enake.

Prva ugibanja - naključnost in neodvisnost podatkov- je treba vedno izvajati, saj je pravilnost vsakega poskusa odvisna od naključnosti izbire in/ali postopka naključnosti. Da bi se izognili pristranskosti rezultatov, je treba podatke črpati iz z splošne populacije naključno in neodvisno drug od drugega. Podobno bi morali biti podatki naključno porazdeljeni z stopnje faktorja, ki nas zanima (eksperimentalne skupine). Kršitev teh pogojev lahko resno popači rezultate analize variance.

Drugo ugibanje - normalnost- pomeni, da so podatki pridobljeni iz normalno porazdeljenih populacij. Kar zadeva t-merila, enosmerna analiza variance na podlagi F-merila sorazmerno malo občutljiva na kršitev tega pogoja. Če porazdelitev ne odstopa preveč od normalne, je stopnja pomembnosti F-merilo se malo spremeni, zlasti če je vzorec dovolj velik. Če je pogoj normalnosti porazdelitve resno kršen, ga je treba uporabiti.

Tretje ugibanje - homogenost variance- pomeni, da so variance vsake populacije med seboj enake (tj. σ 1 2 = σ 2 2 = ... = σ j 2). Ta predpostavka omogoča, da se odločimo, ali bomo ločili ali združili variance znotraj skupine. Če so velikosti skupin enake, pogoj homogenosti variance malo vpliva na zaključke, pridobljene z F-merila. Če pa so velikosti vzorcev neenake, lahko kršitev pogoja enakosti varianc resno popači rezultate analize variance. Zato si je treba prizadevati za zagotovitev enake velikosti vzorcev. Ena od metod za preverjanje predpostavke o homogenosti variance je kriterij Levene opisano spodaj.

Če je od vseh treh pogojev kršen samo pogoj homogenosti variance, sledi postopek, podoben t-merilo z uporabo ločene variance (za več podrobnosti glejte). Če pa sta hkrati kršeni predpostavki normalne porazdelitve in homogenosti variance, je treba podatke normalizirati in zmanjšati razlike med variancami ali pa uporabiti neparametrični postopek.

Levenov test za testiranje homogenosti variance

čeprav F- kriterij je relativno odporen na kršitve pogoja enakosti variance v skupinah; huda kršitev te predpostavke pomembno vpliva na stopnjo pomembnosti in moči kriterija. Morda je eno najmočnejših merilo Levene. Za preverjanje enakosti varianc z splošne populacije, bomo testirali naslednje hipoteze:

Н 0: σ 1 2 = σ 2 2 = … = σj 2

H 1: Ne vsi σ j 2 so enaki ( j = 1, 2, …, z)

Modificirani Levenov test temelji na izjavi, da če je variabilnost v skupinah enaka, lahko analizo variance v absolutnih vrednostih razlik med opazovanji in medianami skupine uporabimo za testiranje ničelne hipoteze o enakosti varianc. Torej bi morali najprej izračunati absolutne vrednosti razlik med opazovanji in medianami v vsaki skupini, nato pa izvesti enosmerno analizo variance na dobljenih absolutnih vrednostih razlik. Za ponazoritev Levenovega kriterija se vrnimo k scenariju, orisanemu na začetku zapisa. Z uporabo podatkov, predstavljenih na sl. 6, bomo izvedli podobno analizo, vendar glede na module razlik v začetnih podatkih in medianah za vsak vzorec posebej (slika 11).

Najnovejši materiali v razdelku:

Bakterije so starodavni organizmi
Bakterije so starodavni organizmi

Arheologija in zgodovina sta dve vedi, ki se tesno prepletata. Arheološke raziskave ponujajo priložnost za spoznavanje preteklosti planeta ...

Povzetek »Oblikovanje črkovalne budnosti pri mlajših šolarjih Pri izvajanju razlagalnega nareka je potrebna razlaga črkovalnih vzorcev, t
Povzetek »Oblikovanje črkovalne budnosti pri mlajših šolarjih Pri izvajanju razlagalnega nareka je potrebna razlaga črkovalnih vzorcev, t

Mestna izobraževalna ustanova "Šola za varnost s. Ozerki Dukhovnitsky okrožja Saratovske regije » Kireeva Tatyana Konstantinovna 2009 – 2010 Uvod. "Pristojno pismo ni ...

Predstavitev: Monako Predstavitev na temo
Predstavitev: Monako Predstavitev na temo

Vera: katolicizem: uradna vera je katolicizem. Vendar monaška ustava zagotavlja svobodo veroizpovedi. Monako ima 5...