Analiza varijanse. Nastavni rad: Analiza varijanse Multivarijantna analiza varijanse

Analiza varijanse je skup statističkih metoda dizajniranih da testiraju hipoteze o odnosu između određenih karakteristika i proučavanih faktora koji nemaju kvantitativni opis, kao i da utvrde stepen uticaja faktora i njihovu interakciju. U stručnoj literaturi se često naziva ANOVA (od engleskog naziva Analysis of Variations). Ovu metodu je prvi razvio R. Fischer 1925. godine.

Vrste i kriterijumi analize varijanse

Ova metoda se koristi za proučavanje odnosa između kvalitativnih (nominalnih) karakteristika i kvantitativne (kontinuirane) varijable. U suštini, testira hipotezu o jednakosti aritmetičkih sredina nekoliko uzoraka. Stoga se može smatrati parametarskim kriterijem za poređenje centara nekoliko uzoraka odjednom. Ako se ova metoda koristi za dva uzorka, rezultati analize varijanse će biti identični rezultatima Studentovog t-testa. Međutim, za razliku od drugih kriterija, ova studija nam omogućava da detaljnije proučimo problem.

Analiza disperzije u statistici se zasniva na zakonu: zbir kvadrata odstupanja kombinovanog uzorka jednak je zbiru kvadrata unutargrupnih devijacija i zbiru kvadrata međugrupnih devijacija. Studija koristi Fisherov test da bi se utvrdila značajnost razlike između međugrupnih varijansi i varijansi unutar grupe. Međutim, neophodni preduslovi za to su normalnost distribucije i homoskedastičnost (jednakost varijansi) uzoraka. Postoje univarijantna (jednofaktorska) analiza varijanse i multivarijantna (multifaktorska). Prvi razmatra ovisnost vrijednosti koja se proučava o jednoj karakteristici, drugi - o mnogima odjednom, a također nam omogućava da identificiramo vezu između njih.

Faktori

Faktori su kontrolisane okolnosti koje utiču na konačni rezultat. Njegov nivo ili metoda obrade je vrijednost koja karakterizira specifičnu manifestaciju ovog stanja. Ovi brojevi se obično prikazuju na nominalnoj ili ordinalnoj skali. Često se izlazne vrijednosti mjere na kvantitativnim ili ordinalnim skalama. Tada nastaje problem grupisanja izlaznih podataka u više opservacija koje odgovaraju približno istim numeričkim vrijednostima. Ako se uzme da je broj grupa preterano velik, onda broj opservacija u njima može biti nedovoljan za dobijanje pouzdanih rezultata. Ako broj uzmete premali, to može dovesti do gubitka značajnih karakteristika uticaja na sistem. Specifičan način grupiranja podataka zavisi od količine i prirode varijacija u vrednostima. Broj i veličina intervala u univarijantnoj analizi najčešće se određuju po principu jednakih intervala ili principu jednakih frekvencija.

Analiza problema varijanse

Dakle, postoje slučajevi kada trebate uporediti dva ili više uzoraka. Tada je preporučljivo koristiti analizu varijanse. Naziv metode ukazuje da se zaključci donose na osnovu proučavanja komponenti varijanse. Suština studije je da se ukupna promjena indikatora podijeli na sastavne dijelove koji odgovaraju djelovanju svakog pojedinačnog faktora. Razmotrimo niz problema koji se rješavaju tipičnom analizom varijanse.

Primjer 1

Radionica ima veliki broj automatskih mašina koje proizvode određeni deo. Veličina svakog dijela je slučajna varijabla koja ovisi o postavci svake mašine i slučajnim odstupanjima koja se javljaju tokom procesa proizvodnje dijelova. Potrebno je na osnovu podataka merenja dimenzija delova utvrditi da li su mašine konfigurisane na isti način.

Primjer 2

Prilikom izrade električnog uređaja koriste se različite vrste izolacionog papira: kondenzatorski, električni itd. Uređaj se može impregnirati raznim supstancama: epoksidna smola, lak, ML-2 smola itd. Curenja se mogu eliminisati pod vakuumom na povišenog pritiska, sa grejanjem. Impregnacija se može obaviti uranjanjem u lak, pod neprekidnim mlazom laka itd. Električni aparat u cjelini se puni određenim smjesom, od čega postoji nekoliko opcija. Pokazatelji kvalitete su električna čvrstoća izolacije, temperatura pregrijavanja namotaja u radnom režimu i niz drugih. Prilikom razvoja tehnološkog procesa izrade uređaja potrebno je utvrditi kako svaki od navedenih faktora utiče na performanse uređaja.

Primjer 3

Trolejbuski depo opslužuje nekoliko trolejbuskih linija. Oni upravljaju trolejbusima raznih tipova, a 125 inspektora naplaćuje karte. Upravu depoa zanima pitanje: kako uporediti ekonomske pokazatelje svakog kontrolora (prihoda) uzimajući u obzir različite rute i različite tipove trolejbusa? Kako odrediti ekonomsku isplativost proizvodnje trolejbusa određenog tipa na određenoj relaciji? Kako uspostaviti razumne zahtjeve za iznos prihoda koji kondukter donosi na svakoj trasi u različitim tipovima trolejbusa?

Zadatak izbora metode je kako dobiti maksimalnu informaciju o utjecaju svakog faktora na konačni rezultat, odrediti numeričke karakteristike takvog utjecaja, njihovu pouzdanost uz minimalne troškove i u najkraćem mogućem vremenu. Metode analize varijanse omogućavaju rješavanje ovakvih problema.

Univarijantna analiza

Svrha studije je procijeniti veličinu uticaja konkretnog slučaja na analizirani pregled. Druga svrha univarijantne analize može biti da uporedi dvije ili više okolnosti jedna s drugom kako bi se utvrdila razlika u njihovom utjecaju na prisjećanje. Ako se nulta hipoteza odbije, onda je sljedeći korak kvantificiranje i konstruiranje intervala povjerenja za dobijene karakteristike. U slučaju kada se nulta hipoteza ne može odbaciti, ona se obično prihvata i donosi zaključak o prirodi uticaja.

Jednosmjerna analiza varijanse može postati neparametarski analog Kruskal-Wallisove rang metode. Razvili su ga američki matematičar William Kruskal i ekonomista Wilson Wallis 1952. godine. Ovaj kriterijum je dizajniran da testira nultu hipotezu o jednakosti efekata na proučavane uzorke sa nepoznatim, ali jednakim prosečnim vrednostima. U ovom slučaju, broj uzoraka mora biti veći od dva.

Jonckheere-Terpstra kriterijum su nezavisno predložili holandski matematičar T. J. Terpstra 1952. godine i britanski psiholog E. R. Jonckheere 1954. godine. Koristi se kada se unapred zna da su postojeće grupe rezultata poređane rastom uticaja faktor koji se proučava, a koji se mjeri na ordinalnoj skali.

M - Bartlettov test, koji je predložio britanski statističar Maurice Stevenson Bartlett 1937. godine, koristi se za testiranje nulte hipoteze o jednakosti varijansi nekoliko normalnih populacija iz kojih su uzeti uzorci koji se proučavaju, uglavnom različite veličine (broj svake uzorak mora biti najmanje četiri).

G - Cochranov test, koji je otkrio Amerikanac William Gemmell Cochran 1941. godine. Koristi se za testiranje nulte hipoteze o jednakosti varijansi normalnih populacija u nezavisnim uzorcima jednake veličine.

Neparametarski Levenov test, koji je predložio američki matematičar Howard Levene 1960. godine, alternativa je Bartlett testu u uslovima u kojima nema pouzdanosti da su uzorci koji se proučavaju podložni normalnoj distribuciji.

Godine 1974. američki statističari Morton B. Brown i Alan B. Forsythe predložili su test (Brown-Forsyth test) koji se malo razlikuje od Levenovog testa.

Dvofaktorska analiza

Dvosmjerna analiza varijanse se koristi za povezane normalno raspoređene uzorke. U praksi se često koriste složene tablice ove metode, posebno one u kojima svaka ćelija sadrži skup podataka (ponovljena mjerenja) koji odgovaraju fiksnim vrijednostima nivoa. Ako pretpostavke potrebne za primjenu dvosmjerne analize varijanse nisu ispunjene, onda koristite neparametarski Friedmanov rang test (Friedman, Kendall i Smith), koji je razvio američki ekonomista Milton Friedman krajem 1930. godine. Ovaj test ne ovisi o vrsti distribucije.

Pretpostavlja se samo da je raspodjela vrijednosti identična i kontinuirana, te da su one same jedna od druge nezavisne. Prilikom testiranja nulte hipoteze, izlazni podaci se prikazuju u obliku pravokutne matrice, u kojoj redovi odgovaraju nivoima faktora B, a stupci nivoima A. Svaka ćelija tabele (bloka) može biti rezultat mjerenja parametara na jednom objektu ili na grupi objekata sa konstantnim vrijednostima nivoa oba faktora. U ovom slučaju, odgovarajući podaci se prikazuju kao prosječne vrijednosti određenog parametra za sve dimenzije ili objekte uzorka koji se proučava. Da bi se primenio izlazni kriterijum, potrebno je preći sa direktnih rezultata merenja na njihov rang. Rangiranje se vrši za svaki red posebno, odnosno vrijednosti se poređaju za svaku fiksnu vrijednost.

Pejdžov test (L-test), koji je predložio američki statističar E. B. Pejdž 1963. godine, dizajniran je da testira nultu hipotezu. Za velike uzorke koristi se Pageova aproksimacija. Oni, podložni realnosti odgovarajućih nultih hipoteza, poštuju standardnu ​​normalnu distribuciju. U slučaju da redovi izvorne tabele imaju iste vrijednosti, potrebno je koristiti prosječne rangove. U ovom slučaju, tačnost zaključaka će biti lošija, što je veći broj takvih utakmica.

Q - Cochranov kriterijum, koji je predložio W. Cochran 1937. godine. Koristi se u slučajevima kada su grupe homogenih subjekata izložene uticajima, čiji broj prelazi dva i za koje su moguće dvije opcije povratne informacije - uslovno negativna (0) i uslovno pozitivan (1) . Nulta hipoteza se sastoji od jednakosti efekata tretmana. Dvosmjerna analiza varijanse omogućava utvrđivanje postojanja efekata tretmana, ali ne omogućava utvrđivanje za koje specifične kolone postoji ovaj efekat. Da bi se riješio ovaj problem, koristi se metoda više Scheffeovih jednačina za povezane uzorke.

Multivarijantna analiza

Problem multivarijantne analize varijanse nastaje kada je potrebno utvrditi uticaj dva ili više uslova na određenu slučajnu varijablu. Studija uključuje prisustvo jedne zavisne slučajne varijable, mjerene na skali razlike ili omjera, i nekoliko nezavisnih varijabli, od kojih je svaka izražena na skali imenovanja ili rangiranja. Analiza varijanse podataka je prilično razvijen dio matematičke statistike, koji ima mnogo opcija. Koncept istraživanja je zajednički i za jednofaktore i za višefaktore. Njegova suština leži u činjenici da je ukupna varijansa podijeljena na komponente, što odgovara određenom grupisanju podataka. Svaka grupa podataka ima svoj model. Ovdje ćemo razmotriti samo osnovne odredbe potrebne za razumijevanje i praktičnu upotrebu njegovih najčešće korištenih opcija.

Analiza varijanse faktora zahtijeva prilično pažljiv odnos prema prikupljanju i prezentaciji ulaznih podataka, a posebno prema interpretaciji rezultata. Za razliku od jednofaktorskog testa, čiji se rezultati mogu uslovno smestiti u određeni niz, rezultati dvofaktorskog testa zahtevaju složeniji prikaz. Situacija postaje još složenija kada postoje tri, četiri ili više okolnosti. Zbog toga je prilično rijetko uključiti više od tri (četiri) uslova u model. Primjer bi bila pojava rezonancije pri određenoj vrijednosti kapacitivnosti i induktivnosti električnog kruga; manifestacija hemijske reakcije sa određenim skupom elemenata od kojih je sistem izgrađen; pojava anomalnih efekata u složenim sistemima pod određenom podudarnošću okolnosti. Prisustvo interakcije može radikalno promijeniti model sistema i ponekad dovesti do preispitivanja prirode fenomena s kojima se eksperimentator bavi.

Multivarijantna analiza varijanse s ponovljenim eksperimentima

Podaci mjerenja se često mogu grupirati ne po dva, već prema većem broju faktora. Dakle, ako uzmemo u obzir disperzijsku analizu vijeka trajanja guma trolejbuskih kotača uzimajući u obzir okolnosti (proizvodni pogon i rutu na kojoj se gumama prometuje), onda kao poseban uslov možemo izdvojiti sezonu tokom koje gume rade (i to: zimski i ljetni pogon). Kao rezultat toga, imaćemo problem trofaktorske metode.

Ako postoji više uslova, pristup je isti kao u dvofaktorskoj analizi. U svim slučajevima pokušavaju da pojednostave model. Fenomen interakcije dva faktora ne javlja se tako često, a trostruka interakcija se javlja samo u izuzetnim slučajevima. Uključite one interakcije za koje postoje prethodne informacije i dobri razlozi da ih uzmete u obzir u modelu. Proces identifikacije pojedinačnih faktora i njihovog uzimanja u obzir relativno je jednostavan. Stoga često postoji želja da se istakne više okolnosti. Ne biste se trebali zanositi ovim. Što je više uslova, to je model manje pouzdan i veća je vjerovatnoća greške. Sam model, koji uključuje veliki broj nezavisnih varijabli, postaje prilično složen za interpretaciju i neprikladan za praktičnu upotrebu.

Opća ideja analize varijanse

Analiza varijanse u statistici je metoda dobijanja rezultata opservacije zavisnih od različitih istovremeno operativnih okolnosti i procjene njihovog uticaja. Kontrolisana varijabla koja odgovara načinu uticaja na predmet proučavanja i dobija određenu vrijednost u određenom vremenskom periodu naziva se faktor. One mogu biti kvalitativne i kvantitativne. Nivoi kvantitativnih uslova dobijaju određeno značenje na numeričkoj skali. Primjeri su temperatura, pritisak pritiska, količina tvari. Kvalitativni faktori su različite supstance, različite tehnološke metode, uređaji, punila. Njihovi nivoi odgovaraju skali imena.

Kvalitet može uključivati ​​i vrstu ambalažnog materijala i uslove skladištenja doznog oblika. Također je racionalno uključiti stepen mljevenja sirovina, frakcijski sastav granula, koji imaju kvantitativni značaj, ali ih je teško regulisati ako se koristi kvantitativna skala. Broj kvalitativnih faktora zavisi od vrste doznog oblika, kao i od fizičkih i tehnoloških svojstava lekovitih supstanci. Na primjer, tablete se mogu dobiti od kristalnih supstanci direktnim kompresijom. U ovom slučaju dovoljno je odabrati klizne i mazive tvari.

Primjeri faktora kvaliteta za različite vrste doznih oblika

  • Tinkture. Sastav ekstraktora, tip ekstraktora, način pripreme sirovine, način proizvodnje, metoda filtracije.
  • Ekstrakti (tečni, gusti, suvi). Sastav ekstratanta, način ekstrakcije, vrsta instalacije, način uklanjanja ekstraktanta i balastnih materija.
  • Pilule. Sastav ekscipijenata, punila, dezintegranata, veziva, maziva i maziva. Način dobijanja tableta, vrsta tehnološke opreme. Vrsta ljuske i njene komponente, formirači filma, pigmenti, boje, plastifikatori, rastvarači.
  • Injekcioni rastvori. Vrsta rastvarača, način filtracije, priroda stabilizatora i konzervansa, uslovi sterilizacije, način punjenja ampula.
  • Supozitorije. Sastav baze za supozitorije, način proizvodnje supozitorija, punila, pakovanja.
  • Masti. Sastav baze, strukturne komponente, način pripreme masti, vrsta opreme, ambalaža.
  • Kapsule. Vrsta materijala ljuske, način proizvodnje kapsula, vrsta plastifikatora, konzervans, boja.
  • Linimenti. Način pripreme, sastav, vrsta opreme, vrsta emulgatora.
  • Suspenzije. Vrsta rastvarača, vrsta stabilizatora, metoda disperzije.

Primjeri faktora kvaliteta i njihovih nivoa proučavanih tokom procesa proizvodnje tableta

  • Brašno. Krompirov skrob, bijela glina, mješavina natrijum bikarbonata sa limunskom kiselinom, bazični magnezijum karbonat.
  • Rešenje za vezivanje. Voda, škrobna pasta, šećerni sirup, rastvor metilceluloze, rastvor hidroksipropilmetilceluloze, rastvor polivinilpirolidona, rastvor polivinil alkohola.
  • Klizna supstanca. Aerosil, skrob, talk.
  • Filler.Šećer, glukoza, laktoza, natrijum hlorid, kalcijum fosfat.
  • Lubricant. Stearinska kiselina, polietilen glikol, parafin.

Modeli analize varijanse u proučavanju nivoa konkurentnosti države

Jedan od najvažnijih kriterijuma za ocjenu stanja države, kojim se ocjenjuje nivo njenog blagostanja i društveno-ekonomskog razvoja, jeste konkurentnost, odnosno skup svojstava svojstvenih nacionalnoj ekonomiji koja određuju državu. sposobnost da se takmiči sa drugim zemljama. Odredivši mjesto i ulogu države na svjetskom tržištu, moguće je uspostaviti jasnu strategiju za osiguranje ekonomske sigurnosti na međunarodnom planu, jer je ona ključna za pozitivne odnose između Rusije i svih igrača na svjetskom tržištu: investitora. , kreditori i vlade.

Da bi se uporedio nivo konkurentnosti država, zemlje se rangiraju pomoću kompleksnih indeksa koji uključuju različite ponderisane indikatore. Ovi indeksi se zasnivaju na ključnim faktorima koji utiču na ekonomsku, političku itd. situaciju. Skup modela za proučavanje konkurentnosti države uključuje korištenje metoda multivarijantne statističke analize (posebno analizu varijanse (statistika), ekonometrijsko modeliranje, donošenje odluka) i uključuje sljedeće glavne faze:

  1. Formiranje sistema indikatora.
  2. Procjena i predviđanje indikatora konkurentnosti države.
  3. Poređenje indikatora konkurentnosti država.

Pogledajmo sada sadržaj modela svake od faza ovog kompleksa.

U prvoj fazi korištenjem stručnih metoda proučavanja formira se utemeljen skup ekonomskih pokazatelja za procjenu konkurentnosti države, uzimajući u obzir specifičnosti njenog razvoja na osnovu međunarodnih rejtinga i podataka statističkih službi, koji odražavaju stanje sistema u cjelini. i njegove procese. Izbor ovih indikatora opravdan je potrebom da se odaberu oni koji nam s praktične tačke gledišta najpotpunije omogućavaju utvrđivanje nivoa države, njene investicione atraktivnosti i mogućnosti relativne lokalizacije postojećih potencijalnih i stvarnih prijetnji.

Glavni pokazatelji međunarodnih rejting sistema su indeksi:

  1. Globalna konkurentnost (GC).
  2. Ekonomska sloboda (IES).
  3. Humani razvoj (HDI).
  4. Percepcija korupcije (CPC).
  5. Interne i eksterne prijetnje (IETH).
  6. Međunarodni potencijal uticaja (IPIP).

Druga faza predviđa procjenu i predviđanje indikatora konkurentnosti države prema međunarodnim ocjenama za 139 zemalja svijeta koje se proučavaju.

Treća faza omogućava poređenje uslova konkurentnosti država korišćenjem metoda korelacione i regresione analize.

Koristeći rezultate studije, moguće je utvrditi prirodu procesa općenito i za pojedine komponente konkurentnosti države; testirati hipotezu o uticaju faktora i njihovih odnosa na odgovarajućem nivou značaja.

Implementacija predloženog skupa modela omogućit će ne samo procjenu trenutnog stanja nivoa konkurentnosti i investicione atraktivnosti država, već i analizu nedostataka upravljanja, spriječiti greške pogrešnih odluka i spriječiti razvoj krize u zemlji. stanje.

Analiza varijanse

1. Koncept analize varijanse

Analiza varijanse je analiza varijabilnosti osobine pod uticajem bilo kojeg kontrolisanog varijabilnog faktora. U stranoj literaturi, analiza varijanse se često naziva ANOVA, što se prevodi kao analiza varijanse (Analysis of Variance).

ANOVA problem sastoji se u izolovanju varijabilnosti različite vrste od opšte varijabilnosti osobine:

a) varijabilnost zbog djelovanja svake od nezavisnih varijabli koje se proučavaju;

b) varijabilnost zbog interakcije nezavisnih varijabli koje se proučavaju;

c) slučajna varijabilnost zbog svih ostalih nepoznatih varijabli.

Varijabilnost zbog djelovanja varijabli koje se proučavaju i njihove interakcije je u korelaciji sa slučajnom varijabilnošću. Pokazatelj ovog odnosa je Fišerov F test.

Formula za izračunavanje F kriterija uključuje procjene varijansi, odnosno parametara distribucije atributa, stoga je F kriterij parametarski kriterij.

Što je varijabilnost osobine više uzrokovana varijablama (faktorima) koje se proučavaju ili njihovom interakcijom, to je veća vrijednosti empirijskih kriterija.

Zero hipoteza u analizi varijanse će reći da su prosječne vrijednosti proučavane efektivne karakteristike iste u svim gradacijama.

Alternativa hipoteza će reći da su prosječne vrijednosti rezultirajuće karakteristike u različitim gradacijama faktora koji se proučavaju različite.

Analiza varijanse nam omogućava da navedemo promjenu karakteristike, ali ne ukazuje smjer ove promjene.

Počnimo naše razmatranje analize varijanse s najjednostavnijim slučajem, kada proučavamo samo djelovanje jedan varijabla (jedan faktor).

2. Jednosmjerna analiza varijanse za nepovezane uzorke

2.1. Svrha metode

Metoda jednofaktorske analize varijanse koristi se u slučajevima kada se proučavaju promjene efektivne karakteristike pod utjecajem promjenjivih uslova ili gradacija faktora. U ovoj verziji metode, uticaj svake od gradacija faktora je drugačije uzorci subjekata. Moraju postojati najmanje tri gradacije faktora. (Možda postoje dvije gradacije, ali u ovom slučaju nećemo moći uspostaviti nelinearne zavisnosti i čini se da je razumnije koristiti jednostavnije).

Neparametrijska verzija ove vrste analize je Kruskal-Wallis H test.

Hipoteze

H 0: Razlike između faktorskih ocjena (različiti uslovi) nisu veće od slučajnih razlika unutar svake grupe.

H 1: Razlike između faktorskih ocjena (različiti uvjeti) veće su od slučajnih razlika unutar svake grupe.

2.2. Ograničenja jednosmjerne analize varijanse za nepovezane uzorke

1. Jednosmjerna analiza varijanse zahtijeva najmanje tri gradacije faktora i najmanje dva predmeta u svakoj gradaciji.

2. Rezultirajuća karakteristika mora biti normalno raspoređena u uzorku koji se proučava.

Istina, obično nije naznačeno da li je riječ o raspodjeli karakteristike u cijelom ispitivanom uzorku ili u onom njegovom dijelu koji čini kompleks disperzije.

3. Primjer rješavanja problema metodom jednosmjerne analize varijanse za nepovezane uzorke na primjeru:

Tri različite grupe od šest ispitanika dobile su liste od deset riječi. Prvoj grupi riječi su predstavljene malom brzinom - 1 riječ u 5 sekundi, drugoj grupi prosječnom brzinom - 1 riječ u 2 sekunde, a trećoj grupi velikom brzinom - 1 riječ u sekundi. Predviđeno je da će performanse reprodukcije zavisiti od brzine prezentacije reči. Rezultati su prikazani u tabeli. 1.

Broj reproduciranih riječi Tabela 1

Predmet br.

mala brzina

prosječna brzina

velika brzina

ukupan iznos

H 0: Razlike u rasponu proizvodnje riječi između grupe nisu izraženije od slučajnih razlika unutra svaka grupa.

H1: Razlike u obimu proizvodnje riječi između grupe su izraženije od slučajnih razlika unutra svaka grupa. Koristeći eksperimentalne vrijednosti prikazane u tabeli. 1, ustanovit ćemo neke vrijednosti koje će biti potrebne za izračunavanje F kriterija.

Izračun glavnih veličina za jednosmjernu analizu varijanse prikazan je u tabeli:

tabela 2

Tabela 3

Redoslijed operacija u jednosmjernoj analizi varijanse za nepovezane uzorke

Često se nalazi u ovoj i narednim tabelama, oznaka SS je skraćenica za "zbir kvadrata". Ova skraćenica se najčešće koristi u prevedenim izvorima.

SS činjenica označava varijabilnost karakteristike zbog djelovanja faktora koji se proučava;

SS općenito- opšta varijabilnost osobine;

S C.A.-varijabilnost zbog neuračunatih faktora, “slučajne” ili “rezidualne” varijabilnosti.

GOSPOĐA- “srednji kvadrat” ili matematičko očekivanje zbira kvadrata, prosječne vrijednosti odgovarajućeg SS.

df - broj stepena slobode, koji smo, uzimajući u obzir neparametarske kriterijume, označili grčkim slovom v.

Zaključak: H 0 je odbijen. H 1 je prihvaćen. Razlike u pamćenju riječi između grupa bile su veće od nasumičnih razlika unutar svake grupe (α=0,05). Dakle, brzina prezentacije riječi utječe na volumen njihove reprodukcije.

U nastavku je prikazan primjer rješavanja problema u Excelu:

Početni podaci:

Koristeći naredbu: Alati->Analiza podataka->Jednosmjerna ANOVA, dobijamo sljedeće rezultate:

Gore navedene tehnike za testiranje statističkih hipoteza o značajnosti razlika između dva srednja vrijednost imaju ograničenu primjenu u praksi. To je zbog činjenice da se u cilju utvrđivanja uticaja svih mogućih uslova i faktora na efektivnu osobinu, terenski i laboratorijski eksperimenti, po pravilu, provode ne dva, već veći broj uzoraka (1220 ili više ).

Istraživači često uspoređuju srednje vrijednosti nekoliko uzoraka spojenih u jedan kompleks. Na primjer, kada se proučava učinak različitih vrsta i doza gnojiva na prinose usjeva, eksperimenti se ponavljaju u različitim verzijama. U tim slučajevima poređenje u paru postaje glomazno, a statistička analiza čitavog kompleksa zahtijeva korištenje posebne metode. Ova metoda, razvijena u matematičkoj statistici, naziva se analiza varijanse. Prvi ga je upotrebio engleski statističar R. Fisher prilikom obrade rezultata agronomskih eksperimenata (1938).

Analiza varijanse je metoda za statističku procjenu pouzdanosti manifestacije zavisnosti efektivne karakteristike od jednog ili više faktora. Koristeći metodu analize varijanse, testiraju se statističke hipoteze u vezi sa prosjekom u nekoliko općih populacija koje imaju normalnu distribuciju.

Analiza varijanse je jedna od glavnih metoda za statističku evaluaciju eksperimentalnih rezultata. Takođe se sve više koristi u analizi ekonomskih informacija. Analiza varijanse omogućava da se utvrdi u kojoj mjeri su pokazatelji uzorka odnosa između rezultantnih i faktorskih karakteristika dovoljni da se podaci dobijeni iz uzorka prošire na opću populaciju. Prednost ove metode je što daje prilično pouzdane zaključke iz malih uzoraka.

Proučavanjem varijacije efektivne karakteristike pod uticajem jednog ili više faktora korišćenjem analize varijanse, može se dobiti, pored opštih procena značaja zavisnosti, i ocena razlika u veličini srednjih vrednosti koje se formiraju. na različitim nivoima faktora, te značaj interakcije faktora. Analiza varijanse se koristi za proučavanje zavisnosti i kvantitativnih i kvalitativnih karakteristika, kao i njihove kombinacije.

Suština ove metode je statističko proučavanje vjerovatnoće utjecaja jednog ili više faktora, kao i njihove interakcije na rezultirajuću karakteristiku. Shodno tome, analizom varijanse rešavaju se tri glavna zadatka: 1) opšta procena značajnosti razlika između grupnih srednjih vrednosti; 2) procenu verovatnoće interakcije između faktora; 3) procena značajnosti razlika između parova sredstava. Najčešće takve probleme istraživači moraju rješavati prilikom izvođenja terenskih i zootehničkih eksperimenata, kada se proučava utjecaj više faktora na efektivno svojstvo.

Osnovna šema analize varijanse uključuje utvrđivanje glavnih izvora varijacije efektivne karakteristike i određivanje obima varijacije (zbir kvadrata odstupanja) prema izvorima njenog formiranja; određivanje broja stupnjeva slobode koji odgovaraju komponentama ukupne varijacije; izračunavanje disperzija kao omjera odgovarajućih volumena varijacije i njihovog broja stupnjeva slobode; analiza odnosa između varijansi; procjenu pouzdanosti razlike između sredstava i izvođenje zaključaka.

Ova shema je sačuvana kako u jednostavnim modelima analize varijanse, kada su podaci grupirani po jednoj karakteristici, tako iu složenim modelima, kada su podaci grupirani po dvije ili više karakteristika. Međutim, sa povećanjem broja grupnih karakteristika, proces dekompozicije ukupne varijacije prema izvorima njenog formiranja postaje složeniji.

Prema principu dijagrama, analiza varijanse se može predstaviti u obliku pet uzastopnih faza:

1) definicija i proširenje varijacije;

2) određivanje broja stepeni slobode varijacije;

3) izračunavanje varijansi i njihovih odnosa;

4) analizu varijansi i njihovih odnosa;

5) procena značajnosti razlike između srednjih vrednosti i formulisanje zaključaka za proveru nulte hipoteze.

Najzahtjevniji dio analize varijanse je prva faza – utvrđivanje i dekomponovanje varijacije prema izvorima njenog formiranja. Redoslijed dekompozicije ukupnog volumena varijacije detaljno je razmotren u 5. poglavlju.

Osnova za rješavanje problema analize varijanse je zakon proširenja (dodavanja) varijacije, prema kojem se ukupna varijacija (fluktuacije) rezultirajućeg atributa dijeli na dva: varijaciju uzrokovanu djelovanjem faktora(a) koji se proučavaju. , i varijacije uzrokovane djelovanjem slučajnih uzroka, tj

Pretpostavimo da je ispitana populacija podijeljena prema faktorskim karakteristikama u nekoliko grupa, od kojih se svaka odlikuje svojom prosječnom vrijednošću rezultirajuće karakteristike. Istovremeno, varijacija ovih vrijednosti može se objasniti s dvije vrste razloga: onima koji djeluju na efektivni znak sistematski i mogu se prilagoditi tokom eksperimenta i onima koji se ne mogu prilagoditi. Očigledno je da međugrupna (faktorska ili sistematska) varijacija zavisi prvenstveno od djelovanja faktora koji se proučava, a unutargrupna (rezidualna ili slučajna) varijacija prvenstveno zavisi od djelovanja slučajnih faktora.

Za procjenu pouzdanosti razlika između grupnih srednjih vrijednosti potrebno je odrediti međugrupne i unutargrupne varijacije. Ako međugrupna (faktorska) varijacija značajno premašuje unutargrupnu (rezidualnu) varijaciju, tada je faktor utjecao na rezultirajuću karakteristiku, značajno mijenjajući vrijednosti grupnih prosjeka. Ali postavlja se pitanje kakav je odnos između međugrupnih i unutargrupnih varijacija koji se može smatrati dovoljnim da se zaključi pouzdanost (značajnost) razlika između grupnih srednjih vrijednosti.

Da bi se procijenila značajnost razlika između srednjih vrijednosti i formulisali zaključci za testiranje nulte hipoteze (H0:x1 = x2 =... = xn) u analizi varijanse, koristi se neka vrsta standarda - G-kriterijum, zakon distribucije koju je ustanovio R. Fisher. Ovaj kriterij je omjer dvije varijanse: faktorijalne, nastale djelovanjem faktora koji se proučava, i rezidualne, zbog djelovanja slučajnih uzroka:

Relacija disperzije Γ = £>u : Američki statističar Snedecor predložio je označavanje £*2 slovom G u čast pronalazača analize varijanse, R. Fishera.

Varijance °2 io2 su procjene varijanse populacije. Ako su uzorci sa varijacijama °2°2 napravljeni iz iste opće populacije, gdje je varijacija vrijednosti bila nasumična, onda je i neslaganje u vrijednostima °2°2 slučajno.

Ako eksperiment istovremeno testira uticaj više faktora (A, B, C, itd.) na efektivnu osobinu, tada bi varijansa usled delovanja svakog od njih trebalo da bude uporediva sa °e.gstr, to je

Ako je vrijednost faktorske disperzije značajno veća od ostatka, tada je faktor značajno utjecao na rezultirajući atribut i obrnuto.

U multifaktorskim eksperimentima, pored varijacije zbog djelovanja svakog faktora, gotovo uvijek postoji varijacija zbog interakcije faktora ($av: ^ls ^vs $lís). Suština interakcije je da se efekat jednog faktora značajno menja na različitim nivoima drugog (na primer, efikasnost kvaliteta zemljišta pri različitim dozama đubriva).

Interakciju faktora takođe treba proceniti upoređivanjem odgovarajućih varijansi 3 ^v.gr:

Prilikom izračunavanja stvarne vrijednosti B-kriterijuma, u brojiocu se uzima veća varijansa, pa je B > 1. Očigledno, što je veći B kriterij, to su razlike između varijansi značajnije. Ako je B = 1, onda se otklanja pitanje procjene značajnosti razlika u varijansama.

Da bi odredio granice slučajnih fluktuacija u omjeru disperzija, G. Fischer je razvio posebne tablice B-distribucije (Dodaci 4 i 5). Kriterijum bi bio funkcionalno povezan sa verovatnoćom i zavisi od broja stepeni slobode varijacije k1 i k2 od dvije upoređene varijanse. Obično se koriste dvije tabele za donošenje zaključaka o izuzetno visokoj vrijednosti kriterija za nivoe značajnosti od 0,05 i 0,01. Nivo značajnosti od 0,05 (ili 5%) znači da samo u 5 slučajeva od 100 kriterijuma B može uzeti vrednost jednaku ili veću od one koja je navedena u tabeli. Smanjenje nivoa značajnosti sa 0,05 na 0,01 dovodi do povećanja vrednosti kriterijuma između dve varijanse usled dejstva samo slučajnih razloga.

Vrijednost kriterija također direktno ovisi o broju stupnjeva slobode dvije disperzije koje se upoređuju. Ako broj stupnjeva slobode teži beskonačnosti (k-me), tada omjer B za dvije disperzije teži jedinici.

Tabelarno prikazana vrijednost kriterija B pokazuje moguću slučajnu vrijednost omjera dvije varijanse na datom nivou značajnosti i odgovarajući broj stupnjeva slobode za svaku od varijansi koja se poredi. Navedene tabele prikazuju vrijednost B za uzorke napravljene iz iste opće populacije, gdje su razlozi promjena vrijednosti samo nasumični.

Vrijednost Γ nalazi se iz tabela (Dodaci 4 i 5) na sjecištu odgovarajuće kolone (broj stupnjeva slobode za veću disperziju - k1) i reda (broj stupnjeva slobode za manju disperziju - k2 ). Dakle, ako je veća varijansa (brojilac G) k1 = 4, a manja varijansa (imenik G) k2 = 9, onda će G na nivou značajnosti a = 0,05 biti 3,63 (Dodatak 4). Dakle, kao rezultat slučajnih uzroka, pošto su uzorci mali, varijansa jednog uzorka može, na nivou značajnosti od 5%, premašiti varijansu drugog uzorka za 3,63 puta. Kada se nivo značajnosti smanji sa 0,05 na 0,01, tabelarna vrednost kriterijuma G, kao što je gore navedeno, će se povećati. Dakle, sa istim stepenima slobode k1 = 4 i k2 = 9 i a = 0,01, tabelarno prikazana vrednost kriterijuma G biće 6,99 (Prilog 5).

Razmotrimo proceduru za određivanje broja stupnjeva slobode u analizi varijanse. Broj stupnjeva slobode, koji odgovara ukupnom zbiru kvadrata odstupanja, razlaže se na odgovarajuće komponente slično kao i razlaganje suma kvadrata odstupanja (^ukupno = No^gr + ]¥vhr), tj. ukupan broj stepeni slobode (k") razlaže se na broj stepena slobode za međugrupne (k1) i unutargrupne (k2) varijacije.

Dakle, ako se populacija uzorka sastoji od N zapažanja podijeljena po T grupe (broj eksperimentalnih opcija) i P podgrupe (broj ponavljanja), tada će broj stupnjeva slobode k prema tome biti:

a) za ukupan zbir kvadrata odstupanja (s7zag)

b) za međugrupni zbir kvadrata odstupanja ^m.gP)

c) za unutargrupni zbir kvadrata odstupanja V v.gR)

Prema pravilu za dodavanje varijacija:

Na primjer, ako su u eksperimentu formirane četiri varijante eksperimenta (t = 4) u po pet ponavljanja (n = 5), a ukupan broj zapažanja je N = = T o p = 4 * 5 = 20, tada je broj stupnjeva slobode shodno tome jednak:

Znajući zbir kvadrata odstupanja i broja stupnjeva slobode, možemo odrediti nepristrasne (ispravljene) procjene za tri varijanse:

Nul-hipoteza H0 se testira korištenjem kriterija B na isti način kao i korištenjem Studentovog t-testa. Za donošenje odluke o provjeri H0 potrebno je izračunati stvarnu vrijednost kriterija i uporediti je sa tabeliranom vrijednošću Ba za prihvaćeni nivo značajnosti a i broj stupnjeva slobode k1 i k2 za dvije disperzije.

Ako je Bfaq > Ba, onda, u skladu sa prihvaćenim nivoom značajnosti, možemo zaključiti da razlike u varijansama uzorka nisu određene samo slučajnim faktorima; oni su značajni. U ovom slučaju, nulta hipoteza se odbacuje i postoji razlog da se tvrdi da faktor značajno utiče na rezultujuću karakteristiku. Ako< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Upotreba određenog modela analize varijanse zavisi i od broja faktora koji se proučavaju i od metode uzorkovanja.

c U zavisnosti od broja faktora koji određuju varijaciju rezultujuće karakteristike, uzorci se mogu formirati prema jednom, dva ili više faktora. Prema tome, analiza varijanse se dijeli na jednofaktorsku i multifaktorsku. Inače se naziva i jednofaktorski i multifaktorski disperzioni kompleks.

Šema dekompozicije ukupne varijacije zavisi od formiranja grupa. Može biti nasumično (zapažanja jedne grupe nisu povezana sa zapažanjima druge grupe) i neslučajna (zapažanja dva uzorka su međusobno povezana zajedničkim eksperimentalnim uslovima). U skladu sa tim se dobijaju nezavisni i zavisni uzorci. Nezavisni uzorci se mogu formirati sa jednakim i neparnim brojevima. Formiranje zavisnih uzoraka pretpostavlja njihovu jednaku veličinu.

Ako su grupe formirane nasumičnim redoslijedom, tada ukupni volumen varijacije rezultirajuće osobine uključuje, uz faktorijalnu (međugrupnu) i rezidualnu varijaciju, varijaciju ponavljanja, tj.

U praksi je u većini slučajeva potrebno uzeti u obzir zavisne uzorke kada su uslovi za grupe i podgrupe izjednačeni. Dakle, u terenskom eksperimentu, cijela lokacija je podijeljena na blokove, sa najrazličitijim uvjetima. U ovom slučaju, svaka varijanta eksperimenta dobija jednake mogućnosti da bude predstavljena u svim blokovima, čime se izjednačavaju uslovi za sve testirane varijante eksperimenta. Ova metoda konstruisanja eksperimenta naziva se metodom nasumičnih blokova. Slično se izvode i eksperimenti sa životinjama.

Prilikom obrade socio-ekonomskih podataka metodom analize varijanse, potrebno je imati na umu da je zbog velikog broja faktora i njihove međusobne povezanosti teško, čak i uz najpažljivije nivelisanje uslova, utvrditi stepen objektivnosti. uticaj svakog pojedinačnog faktora na rezultujuću karakteristiku. Dakle, nivo rezidualne varijacije određen je ne samo slučajnim uzrocima, već i značajnim faktorima koji nisu uzeti u obzir pri konstruisanju modela analize varijanse. Kao rezultat toga, rezidualna varijansa kao osnova za poređenje ponekad postaje neadekvatna za svoju svrhu; U tom smislu, prilikom konstruisanja modela analize varijanse, postaje relevantan problem odabira najvažnijih faktora i nivelisanja uslova za ispoljavanje delovanja svakog od njih. Osim toga. upotreba analize varijanse pretpostavlja normalnu ili blisku normalnoj distribuciji statističkih populacija koje se proučavaju. Ako ovaj uslov nije ispunjen, onda će procjene dobijene analizom varijanse biti preuveličane.

Osoba može prepoznati svoje sposobnosti samo ako ih pokuša primijeniti. (Seneca)

Analiza varijanse

Uvodni pregled

U ovom dijelu ćemo pregledati osnovne metode, pretpostavke i terminologiju ANOVA-e.

Imajte na umu da se u literaturi na engleskom jeziku analiza varijanse obično naziva analiza varijacije. Stoga, radi sažetosti, u nastavku ćemo ponekad koristiti termin ANOVA (An alysis o f va rijacija) za običnu ANOVA-u i termin MANOVA za multivarijantnu analizu varijanse. U ovom dijelu ćemo uzastopno pregledati glavne ideje analize varijanse ( ANOVA), analiza kovarijanse ( ANCOVA), multivarijantna analiza varijanse ( MANOVA) i multivarijantna analiza kovarijanse ( MANCOVA). Nakon kratke rasprave o prednostima kontrastne analize i post hoc testova, pogledajmo pretpostavke na kojima su zasnovane ANOVA metode. Na kraju ovog odjeljka objašnjene su prednosti multivarijatnog pristupa za analizu ponovljenih mjera u odnosu na tradicionalni univarijantni pristup.

Ključne ideje

Svrha analize varijanse. Glavna svrha analize varijanse je da se ispita značaj razlika između srednjih vrijednosti. Poglavlje (Poglavlje 8) daje kratak uvod u proučavanje statističke značajnosti. Ako jednostavno uspoređujete srednje vrijednosti dva uzorka, analiza varijanse će dati isti rezultat kao i obična analiza. t- test za nezavisne uzorke (ako se porede dve nezavisne grupe objekata ili zapažanja) ili t- kriterijum za zavisne uzorke (ako se dve varijable porede na istom skupu objekata ili posmatranja). Ako niste upoznati s ovim kriterijima, preporučujemo da pogledate uvodni pregled poglavlja (poglavlje 9).

Odakle je došlo ime Analiza varijanse? Može izgledati čudno da se postupak za poređenje srednjih vrijednosti naziva analiza varijanse. U stvarnosti, to je zato što kada ispitujemo statističku značajnost razlika između srednjih vrijednosti, mi zapravo analiziramo varijanse.

Particioniranje zbira kvadrata

Za veličinu uzorka n, varijansa uzorka se izračunava kao zbir kvadrata odstupanja od srednje vrijednosti uzorka podijeljen sa n-1 (veličina uzorka minus jedan). Dakle, za fiksnu veličinu uzorka n, varijansa je funkcija zbira kvadrata (odstupanja), označena, radi kratkoće, SS(od engleskog Sum of Squares - Sum of Squares). Osnova analize varijanse je odvajanje (ili particioniranje) varijanse na dijelove. Razmotrite sljedeći skup podataka:

Srednja vrijednost dvije grupe značajno se razlikuje (2 i 6, respektivno). Zbir kvadrata odstupanja unutra svaka grupa je jednaka 2. Sabirajući ih, dobijamo 4. Ako sada ponovimo ove proračune isključujućičlanstvo u grupi, odnosno ako računamo SS na osnovu ukupne srednje vrednosti dva uzorka, dobijamo 28. Drugim rečima, varijansa (zbir kvadrata) zasnovana na varijabilnosti unutar grupe rezultira mnogo manjim vrednostima nego kada se izračunava na osnovu ukupne varijabilnosti (u odnosu na ukupna srednja vrijednost). Razlog tome je očito značajna razlika između srednjih vrijednosti, a ta razlika između srednjih vrijednosti objašnjava postojeću razliku između zbira kvadrata. Zapravo, ako koristite modul za analizu datih podataka Analiza varijanse, dobiće se sljedeći rezultati:

Kao što se može vidjeti iz tabele, ukupan zbir kvadrata SS=28 podijeljeno je zbirom kvadrata datim sa unutargrupa varijabilnost ( 2+2=4 ; vidi drugi red tabele) i zbir kvadrata zbog razlike u srednjim vrednostima. (28-(2+2)=24; vidi prvi red tabele).

SS greške iSS efekat. varijabilnost unutar grupe ( SS) se obično naziva disperzija greške. To znači da se obično ne može predvidjeti ili objasniti kada se eksperiment izvodi. Na drugoj strani, SS efekat(ili varijabilnost između grupa) može se objasniti razlikama između srednjih vrijednosti ispitivanih grupa. Drugim riječima, pripadnost određenoj grupi objašnjava međugrupna varijabilnost, jer znamo da ove grupe imaju različita sredstva.

Provjera značaja. Osnovne ideje testiranja statističke značajnosti razmatrane su u poglavlju Osnovni koncepti statistike(poglavlje 8). Ovo poglavlje također objašnjava razloge zašto mnogi testovi koriste omjer objašnjene i neobjašnjive varijanse. Primjer ove upotrebe je analiza same varijanse. Testiranje značajnosti u ANOVA bazira se na poređenju varijanse zbog varijanse između grupa (tzv. efekat srednjeg kvadrata ili GOSPOĐAEfekat) i varijansu zbog varijacije unutar grupe (tzv srednja kvadratna greška ili GOSPOĐAgreška). Ako je nulta hipoteza (jednakost srednjih vrijednosti u dvije populacije) tačna, onda bi se očekivala relativno mala razlika u srednjim vrijednostima uzorka zbog slučajne varijacije. Prema tome, pod nultom hipotezom, varijansa unutar grupe će se praktično poklapati sa ukupnom varijansom izračunatom bez uzimanja u obzir pripadnosti grupi. Rezultirajuće varijanse unutar grupe mogu se uporediti pomoću F- test koji provjerava da li je omjer varijanse značajno veći od 1. U primjeru o kojem se gore govori F- kriterijum pokazuje da je razlika između srednjih vrednosti statistički značajna.

Osnovna logika analize varijanse. Da rezimiramo, svrha ANOVA je testiranje statističke značajnosti razlike između srednjih vrijednosti (za grupe ili varijable). Ova provjera se provodi analizom varijanse, tj. dijeljenjem ukupne varijanse (varijacije) na dijelove, od kojih je jedan rezultat slučajne greške (tj. unutargrupne varijabilnosti), a drugi je povezan s razlikama u srednjim vrijednostima. Posljednja komponenta varijanse se tada koristi za analizu statističke značajnosti razlike između srednjih vrijednosti. Ako je ova razlika značajna, nulta hipoteza se odbacuje i prihvaća alternativna hipoteza da postoji razlika između srednjih vrijednosti.

Zavisne i nezavisne varijable. Pozivaju se varijable čije su vrijednosti određene mjerenjima tokom eksperimenta (na primjer, rezultat testa). zavisan varijable. Varijable koje se mogu kontrolisati u eksperimentu (na primjer, nastavne metode ili drugi kriteriji za podjelu opažanja u grupe) nazivaju se faktori ili nezavisni varijable. Ovi koncepti su detaljnije opisani u poglavlju Osnovni koncepti statistike(poglavlje 8).

Multivarijantna analiza varijanse

U jednostavnom primjeru iznad, možete odmah izračunati t-test nezavisnih uzoraka koristeći odgovarajuću opciju modula Osnovne statistike i tabele. Dobiveni rezultati će se prirodno poklopiti sa rezultatima analize varijanse. Međutim, ANOVA sadrži fleksibilne i moćne tehnike koje se mogu koristiti za mnogo složenije studije.

Mnogo faktora. Svijet je složen i višedimenzionalan po prirodi. Izuzetno su rijetke situacije kada je određena pojava potpuno opisana jednom varijablom. Na primjer, ako pokušavamo naučiti kako uzgajati velike rajčice, trebali bismo uzeti u obzir faktore povezane s genetskom strukturom biljke, tipom tla, svjetlošću, temperaturom itd. Dakle, prilikom izvođenja tipičnog eksperimenta, mora se suočiti sa velikim brojem faktora. Glavni razlog zašto je korištenje ANOVA poželjnije od ponovljenih poređenja dva uzorka na različitim nivoima faktora korištenjem t- Kriterijum je da je analiza varijanse više efektivno i, za male uzorke, informativniji.

Faktorsko upravljanje. Pretpostavimo da u primeru analize dva uzorka o kojem smo gore govorili, dodamo još jedan faktor, npr. Kat- Rod. Neka se svaka grupa sastoji od 3 muškarca i 3 žene. Dizajn ovog eksperimenta može se predstaviti u obliku tabele 2x2:

Eksperimentiraj. Grupa 1 Eksperimentiraj. Grupa 2
Muškarci2 6
3 7
1 5
Prosjek2 6
Žene4 8
5 9
3 7
Prosjek4 8

Prije nego što izvršite izračune, možete primijetiti da u ovom primjeru ukupna varijansa ima najmanje tri izvora:

(1) slučajna greška (unutar grupne varijanse),

(2) varijabilnost povezana sa članstvom u eksperimentalnoj grupi, i

(3) varijabilnost zbog pola objekata posmatranja.

(Imajte na umu da postoji još jedan mogući izvor varijabilnosti - interakcija faktora, o čemu ćemo kasnije govoriti). Šta će se dogoditi ako ne uključimo katspol kao faktor u analizi i izračunajte uobičajeno t-kriterijum? Ako izračunamo sume kvadrata, zanemarimo sprat -spol(tj. kombinovanje objekata različitog pola u jednu grupu prilikom izračunavanja varijanse unutar grupe, čime se dobija zbir kvadrata za svaku grupu jednak SS=10, i ukupan zbir kvadrata SS= 10+10 = 20), tada dobijamo veću vrijednost unutargrupne varijanse nego preciznijom analizom sa dodatnom podjelom na podgrupe prema polu- spol(u ovom slučaju, srednja vrijednost unutar grupe će biti jednaka 2, a ukupni zbir kvadrata unutar grupe će biti jednak SS = 2+2+2+2 = 8). Ova razlika je zbog činjenice da je prosječna vrijednost za muškarci - mužjaci manje od prosjeka za žene -žensko, a ova razlika u srednjim vrijednostima povećava ukupnu varijabilnost unutar grupe kada se spol ne uzima u obzir. Kontrola varijanse greške povećava osjetljivost (snagu) testa.

Ovaj primjer pokazuje još jednu prednost analize varijanse u odnosu na konvencionalnu t- kriterijum za dva uzorka. Analiza varijanse vam omogućava da proučavate svaki faktor kontrolirajući vrijednosti preostalih faktora. To je, zapravo, glavni razlog njegove veće statističke moći (za dobijanje smislenih rezultata potrebne su manje veličine uzorka). Iz tog razloga, analiza varijanse, čak i na malim uzorcima, daje statistički značajnije rezultate od jednostavne t- kriterijum.

Efekti interakcije

Postoji još jedna prednost korištenja analize varijanse u odnosu na konvencionalnu t- kriterijum: analiza varijanse nam omogućava da otkrijemo interakcija između faktora i stoga omogućava proučavanje složenijih modela. Za ilustraciju, razmotrite još jedan primjer.

Glavni efekti, parne (dvofaktorske) interakcije. Pretpostavimo da postoje dvije grupe učenika, a psihološki su učenici prve grupe odlučni da urade postavljene zadatke i svrsishodniji su od učenika druge grupe koju čine lijeniji učenici. Hajde da nasumično podijelimo svaku grupu na pola i jednoj polovini svake grupe damo težak zadatak, a drugoj polovini lakši. Zatim ćemo izmjeriti koliko naporno učenici rade na ovim zadacima. Prosjeci za ovu (izmišljenu) studiju prikazani su u tabeli:

Kakav zaključak se može izvući iz ovih rezultata? Možemo li zaključiti da: (1) učenici intenzivnije rade na složenom zadatku; (2) Da li motivirani učenici rade više od lijenih? Nijedna od ovih izjava ne obuhvata suštinu sistematske prirode sredstava prikazanih u tabeli. Analizirajući rezultate, ispravnije bi bilo reći da samo motivisani učenici više rade na teškim zadacima, dok samo lijeni učenici više rade na lakim zadacima. Drugim riječima, karakter učenika i težina zadatka interakciju utiču jedni na druge na uloženi napor. To je primjer interakcija u paru između karaktera učenika i težine zadatka. Imajte na umu da izjave 1 i 2 opisuju glavni efekti.

Interakcije višeg reda. Dok je interakcije u paru još uvijek relativno lako objasniti, interakcije višeg reda je mnogo teže objasniti. Zamislimo da je u gore razmatranom primjeru uveden još jedan faktor kat -Rod i dobili smo sljedeću tabelu prosjeka:

Koji se zaključci sada mogu izvući iz dobijenih rezultata? Prosječni zapleti olakšavaju tumačenje složenih efekata. Modul ANOVA vam omogućava da napravite ove grafikone sa skoro jednim klikom miša.

Slika u grafikonima ispod predstavlja interakciju tri faktora koja se proučava.

Gledajući grafikone, možemo reći da za žene postoji interakcija između ličnosti i poteškoća u testiranju: motivisane žene više rade na teškom zadatku nego na lakom. Za muškarce, ista interakcija je obrnuta. Može se vidjeti da opis interakcije između faktora postaje sve zbunjujući.

Opšti način opisivanja interakcija. Općenito, interakcija između faktora se opisuje kao promjena jednog efekta pod utjecajem drugog. U primjeru o kojem je gore raspravljano, dvofaktorska interakcija se može opisati kao promjena glavnog efekta faktora koji karakterizira težinu zadatka pod utjecajem faktora koji opisuje karakter učenika. Za interakciju tri faktora iz prethodnog stava možemo reći da se interakcija dva faktora (složenost zadatka i karakter učenika) menja pod uticajem spolRod. Ako se proučava interakcija četiri faktora, možemo reći da se interakcija tri faktora mijenja pod uticajem četvrtog faktora, tj. Postoje različite vrste interakcija na različitim nivoima četvrtog faktora. Pokazalo se da u mnogim područjima interakcija pet ili čak više faktora nije neobična.

Komplikovani planovi

Dizajni između grupe i unutar grupe (nacrti ponovljenih mjera)

Kada se porede dve različite grupe, obično se koristi t- kriterijum za nezavisne uzorke (iz modula Osnovne statistike i tabele). Kada se dvije varijable uspoređuju na istom skupu objekata (zapažanja), koristi se t-kriterijum za zavisne uzorke. Za analizu varijanse takođe je važno da li su uzorci zavisni ili ne. Ako postoje ponovljena mjerenja istih varijabli (pod različitim uvjetima ili u različito vrijeme) za iste objekte, zatim govore o prisustvu faktor ponovljenih mjera(takođe se zove unutargrupni faktor, budući da se unutar grupe zbir kvadrata izračunava da bi se procijenila njegova važnost). Ako se uporede različite grupe predmeta (npr. muškarci i žene, tri soja bakterija, itd.), onda se opisuje razlika između grupa međugrupni faktor. Metode za izračunavanje kriterijuma značajnosti za dva opisana tipa faktora su različite, ali su im opšta logika i tumačenja ista.

Među- i unutar-grupni planovi. U mnogim slučajevima, eksperiment zahtijeva uključivanje faktora između subjekata i faktora ponovljenih mjerenja u dizajn. Na primjer, mjere se matematičke vještine učenika i učenika (gdje sprat -Rod-međugrupni faktor) na početku i na kraju semestra. Dvije mjere vještina svakog učenika čine faktor unutar grupe (faktor ponovljenih mjerenja). Tumačenje glavnih efekata i interakcija za faktore između predmeta i ponovljenih mjera je konzistentno, a obje vrste faktora očigledno mogu međusobno djelovati (npr. žene stječu vještine tokom semestra, dok ih muškarci gube).

Nepotpuni (ugniježđeni) planovi

U mnogim slučajevima efekat interakcije se može zanemariti. To se dešava ili kada se zna da nema interakcijskog efekta u populaciji, ili kada je implementacija potpuna faktorijel plan je nemoguć. Na primjer, proučava se učinak četiri aditiva za gorivo na potrošnju goriva. Odabrana su četiri automobila i četiri vozača. Pun faktorijel eksperiment zahtijeva da se svaka kombinacija: aditiv, vozač, auto - pojavi barem jednom. Za ovo je potrebno najmanje 4 x 4 x 4 = 64 grupe testova, što oduzima previše vremena. Uz to, malo je vjerovatno da će doći do bilo kakve interakcije između vozača i aditiva za gorivo. Uzimajući to u obzir, možete koristiti plan latinski kvadrati, koji sadrži samo 16 test grupa (četiri aditiva su označena slovima A, B, C i D):

Latinski kvadrati su opisani u većini knjiga o eksperimentalnom dizajnu (npr. Hays, 1988; Lindman, 1974; Milliken i Johnson, 1984; Winer, 1962) i ovdje se neće detaljno raspravljati. Imajte na umu da su latinični kvadrati Nenpun dizajni u kojima nisu uključene sve kombinacije nivoa faktora. Na primjer, vozač 1 vozi auto 1 samo sa dodatkom A, vozač 3 vozi auto 1 samo sa dodatkom C. Nivoi faktora aditivi ( A, B, C i D) su ugniježđene u ćelije tabele automobil x vozač - kao jaja u gnezdima. Ova mnemonika je korisna za razumijevanje prirode ugniježđen ili ugniježđen planove. Modul Analiza varijanse pruža jednostavne načine za analizu ovih tipova planova.

Kovarijansna analiza

glavna ideja

U poglavlju Ključne ideje Ukratko je razmotrena ideja kontrole faktora i kako uključivanje aditivnih faktora smanjuje zbir grešaka na kvadrat i povećava statističku moć dizajna. Sve se to može proširiti na varijable s kontinuiranim skupom vrijednosti. Kada su takve kontinuirane varijable uključene kao faktori u dizajnu, one se nazivaju kovarijati.

Fiksne kovarijate

Pretpostavimo da upoređujemo matematičke vještine dvije grupe učenika koji su podučavani koristeći dva različita udžbenika. Pretpostavimo i da su podaci o kvocijentu inteligencije (IQ) dostupni za svakog učenika. Možete pretpostaviti da je IQ povezan s matematičkim vještinama i koristiti te informacije. Za svaku od dvije grupe učenika može se izračunati koeficijent korelacije između IQ-a i matematičkih vještina. Koristeći ovaj koeficijent korelacije, moguće je izolovati udio varijanse u grupama koji se objašnjava utjecajem IQ-a i neobjašnjivog udjela varijanse (vidi također Osnovni koncepti statistike(poglavlje 8) i Osnovne statistike i tabele(poglavlje 9)). Preostali dio varijanse se koristi u analizi kao varijansa greške. Ako postoji korelacija između IQ-a i matematičkih vještina, tada se varijansa greške može značajno smanjiti SS/(n-1) .

Uticaj kovarijati naF- kriterijum. F- kriterij procjenjuje statističku značajnost razlike srednjih vrijednosti u grupama, a izračunava se omjer međugrupne varijanse ( GOSPOĐAefekat) do varijance greške ( GOSPOĐAgreška) . Ako GOSPOĐAgreška smanjuje se, na primjer, kada se uzme u obzir IQ faktor, vrijednost F povećava.

Mnogo kovarijacija. Gore korišćeno rezonovanje za jednu kovarijatu (IQ) može se lako proširiti na više kovarijata. Na primjer, pored IQ-a, možete uključiti mjerenja motivacije, prostornog razmišljanja itd. Umjesto uobičajenog koeficijenta korelacije, koristi se višestruki koeficijent korelacije.

Kada vrijednostF - kriteriji se smanjuju. Ponekad uvođenje kovarijata u eksperimentalni dizajn smanjuje značaj F-kriterijumi . Ovo obično ukazuje da su kovarijate u korelaciji ne samo sa zavisnom varijablom (npr. matematičke vještine), već i sa faktorima (npr. različiti udžbenici). Pretpostavimo da se IQ mjeri na kraju semestra, nakon skoro godinu dana podučavanja dvije grupe studenata koristeći dva različita udžbenika. Iako su učenici raspoređeni u grupe nasumično, moguće je da su razlike u udžbenicima toliko velike da će i IQ i matematičke vještine uvelike varirati između grupa. U ovom slučaju, kovarijate ne samo da smanjuju varijansu greške već i varijansu između grupa. Drugim riječima, nakon kontrole razlika u IQ-u među grupama, razlike u matematičkim vještinama više nisu značajne. Možete reći drugačije. Nakon „isključivanja“ uticaja IQ-a, nenamerno se isključuje uticaj udžbenika na razvoj matematičkih veština.

Prilagođeni prosjeci. Kada kovarijanta utiče na faktor između subjekata, treba izračunati prilagođena sredstva, tj. ona sredstva koja se dobiju nakon uklanjanja svih kovarijatnih procjena.

Interakcije između kovarijati i faktora. Baš kao što se ispituju interakcije između faktora, mogu se ispitati interakcije između kovarijata i između grupa faktora. Recimo da je jedan od udžbenika posebno pogodan za pametne učenike. Drugi udžbenik je dosadan za pametne učenike, a isti udžbenik je težak za manje pametne učenike. Kao rezultat, postoji pozitivna korelacija između IQ-a i ishoda učenja u prvoj grupi (pametniji učenici, bolji rezultati) i nula ili neznatna negativna korelacija u drugoj grupi (što je učenik pametniji, manja je vjerovatnoća da će steći matematičke vještine iz drugog udžbenika). Neke studije razmatraju ovu situaciju kao primjer kršenja pretpostavki kovarijansne analize. Međutim, budući da ANOVA modul koristi najčešće metode analize kovarijanse, moguće je, posebno, procijeniti statističku značajnost interakcije između faktora i kovarijanti.

Varijabilne kovarijate

Dok se fiksne kovarijate dosta često govore u udžbenicima, varijabilne kovarijate se pominju mnogo rjeđe. Obično, kada provodimo eksperimente s ponovljenim mjerenjima, zanimaju nas razlike u mjerenjima istih veličina u različitim vremenskim trenucima. Naime, zanima nas značaj ovih razlika. Ako se kovarijate mjere istovremeno s mjerenjima zavisnih varijabli, može se izračunati korelacija između kovarijate i zavisne varijable.

Na primjer, interes za matematiku i matematičke vještine mogu se istražiti na početku i na kraju semestra. Bilo bi zanimljivo provjeriti da li su promjene u interesu za matematiku u korelaciji sa promjenama u matematičkim vještinama.

Modul Analiza varijanse V STATISTICA automatski procjenjuje statističku značajnost promjena u kovarijati u dizajnu gdje je to moguće.

Multivarijantni dizajn: multivarijantna analiza varijanse i kovarijanse

Međugrupni planovi

Svi prethodno razmotreni primjeri uključivali su samo jednu zavisnu varijablu. Kada postoji više zavisnih varijabli u isto vrijeme, samo se povećava složenost proračuna, ali se sadržaj i osnovni principi ne mijenjaju.

Na primjer, studija se izvodi na dva različita udžbenika. Istovremeno se proučava uspjeh učenika u izučavanju fizike i matematike. U ovom slučaju postoje dvije zavisne varijable i potrebno je otkriti kako dva različita udžbenika utječu na njih istovremeno. Da biste to učinili, možete koristiti multivarijantnu analizu varijanse (MANOVA). Umjesto jednodimenzionalnog F kriterij, koristi se višedimenzionalno F test (Wilksov l test), zasnovan na poređenju matrice kovarijanse greške i matrice kovarijanse među grupama.

Ako su zavisne varijable međusobno povezane, onda ovu korelaciju treba uzeti u obzir prilikom izračunavanja kriterija značajnosti. Očigledno, ako se isto mjerenje ponovi dva puta, onda se ne može dobiti ništa novo. Ako se postojećoj dimenziji doda korelirana dimenzija, dobivaju se neke nove informacije, ali nova varijabla sadrži suvišne informacije, što se odražava u kovarijansi između varijabli.

Interpretacija rezultata. Ako je ukupni multivarijantni test značajan, možemo zaključiti da je odgovarajući efekat (npr. tip udžbenika) značajan. Međutim, postavljaju se sljedeća pitanja. Da li tip udžbenika utiče na poboljšanja samo matematičkih vještina, samo fizičkih vještina ili obje vještine? U stvari, nakon dobijanja značajnog multivarijantnog testa, univarijantni test se ispituje za pojedinačni glavni efekat ili interakciju. F kriterijum. Drugim riječima, zavisne varijable koje doprinose značajnosti multivarijatnog testa se ispituju zasebno.

Dizajni ponovljenih mjera

Ako se na početku semestra i na kraju semestra mjere matematičke i fizičke vještine, onda su to ponovljene mjere. Proučavanje kriterijuma značaja u takvim planovima je logičan razvoj jednodimenzionalnog slučaja. Imajte na umu da se multivarijantna analiza tehnika varijanse takođe obično koristi za ispitivanje značaja faktora univarijantnih ponovljenih mjera koji imaju više od dva nivoa. Odgovarajuće aplikacije će biti razmatrane kasnije u ovom dijelu.

Sumiranje vrijednosti varijabli i multivarijantna analiza varijanse

Čak i iskusnim korisnicima univarijantne i multivarijantne analize varijanse često je teško dobiti različite rezultate kada primjenjuju multivarijantnu analizu varijanse, na primjer, na tri varijable, a kada primjenjuju univarijantnu analizu varijanse na zbir ove tri varijable, kao da bile jedna varijabla.

Ideja sumiranje varijabla je da svaka varijabla sadrži neku istinitu varijablu, koja se proučava, kao i slučajnu grešku mjerenja. Stoga, kada se prosječuju vrijednosti varijabli, greška mjerenja će biti bliža 0 za sva mjerenja i prosječne vrijednosti će biti pouzdanije. Zapravo, u ovom slučaju, primjena ANOVA na zbir varijabli je razumna i moćna tehnika. Međutim, ako su zavisne varijable višedimenzionalne prirode, zbrajanje vrijednosti varijabli je neprikladno.

Na primjer, neka se zavisne varijable sastoje od četiri indikatora uspjeh u društvu. Svaki pokazatelj karakterizira potpuno nezavisan aspekt ljudske aktivnosti (na primjer, profesionalni uspjeh, uspjeh u poslu, porodično blagostanje, itd.). Dodavanje ovih varijabli je kao dodavanje jabuka i narandži. Zbir ovih varijabli ne bi bio odgovarajuća jednodimenzionalna mjera. Stoga se takvi podaci moraju tretirati kao višedimenzionalni indikatori u multivarijantna analiza varijanse.

Kontrastna analiza i post hoc testovi

Zašto se upoređuju odvojeni skupovi prosjeka?

Tipično, hipoteze o eksperimentalnim podacima nisu formulisane samo u smislu glavnih efekata ili interakcija. Primjer bi bila ova hipoteza: određeni udžbenik poboljšava matematičke vještine samo kod učenika, dok je drugi udžbenik približno podjednako efikasan za oba spola, ali je još manje efikasan za muškarce. Može se predvidjeti da je efikasnost udžbenika u interakciji sa polom učenika. Međutim, važi i ova prognoza priroda interakcije. Očekuje se značajna razlika između polova za učenike koji koriste jednu knjigu i praktično nezavisni rezultati prema polu za učenike koji koriste drugu knjigu. Ova vrsta hipoteze se obično ispituje upotrebom kontrastne analize.

Analiza kontrasta

Ukratko, kontrastna analiza omogućava da se proceni statistička značajnost određenih linearnih kombinacija složenih efekata. Kontrastna analiza je glavni i obavezni element svakog kompleksnog ANOVA plana. Modul Analiza varijanse ima dosta različitih mogućnosti analize kontrasta koje vam omogućavaju da izolujete i analizirate bilo koju vrstu poređenja sredstava.

A posteriori poređenja

Ponekad se, kao rezultat obrade eksperimenta, otkrije neočekivani efekat. Iako će u većini slučajeva kreativni istraživač biti u stanju da objasni bilo koji rezultat, to ne dozvoljava dalju analizu i procjene za predviđanje. Ovaj problem je jedan od onih zbog kojih a posteriori kriterijumi, odnosno kriterijumi koji se ne koriste a priori hipoteze. Za ilustraciju, razmotrite sljedeći eksperiment. Pretpostavimo da postoji 100 kartica koje sadrže brojeve od 1 do 10. Stavljajući sve ove kartice u zaglavlje, nasumično biramo 5 kartica 20 puta i izračunavamo prosječnu vrijednost (prosjek brojeva napisanih na karticama) za svaki uzorak. Možete li očekivati ​​da će postojati dva uzorka čija se sredina značajno razlikuju? Ovo je vrlo uvjerljivo! Odabirom dva uzorka s maksimalnom i minimalnom srednjom vrijednosti, možete dobiti razliku u srednjim vrijednostima koja se jako razlikuje od razlike u srednjim vrijednostima, na primjer, prva dva uzorka. Ova razlika se može istražiti, na primjer, upotrebom kontrastne analize. Ne ulazeći u detalje, postoji nekoliko tzv a posteriori kriterijumi koji se zasnivaju upravo na prvom scenariju (uzimanje ekstremnih srednjih vrednosti od 20 uzoraka), odnosno ovi kriterijumi se zasnivaju na odabiru najrazličitijih sredstava za poređenje svih sredstava u dizajnu. Ovi kriterijumi se koriste kako bi se osiguralo da se veštački efekat ne dobije čisto slučajno, na primer, da bi se otkrila značajna razlika između sredstava kada ih nema. Modul Analiza varijanse nudi širok spektar takvih kriterijuma. Kada se naiđu neočekivani rezultati u eksperimentu koji uključuje nekoliko grupa, onda a posteriori procedure za ispitivanje statističke značajnosti dobijenih rezultata.

Zbir kvadrata tipa I, II, III i IV

Multivarijantna regresija i analiza varijanse

Postoji bliska veza između metode multivarijantne regresije i analize varijanse (analize varijanse). U obje metode proučava se linearni model. Ukratko, gotovo svi eksperimentalni dizajni mogu se ispitati korištenjem multivarijantne regresije. Razmislite o sljedećem jednostavnom dizajnu međugrupa 2 x 2.

D.V. A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Kolone A i B sadrže kodove koji karakterišu nivoe faktora A i B, kolona AxB sadrži proizvod dva stupca A i B. Ove podatke možemo analizirati koristeći multivarijantnu regresiju. Varijabilna D.V. definirana kao zavisna varijabla, varijable iz A prije AxB kao nezavisne varijable. Proučavanje značaja za koeficijente regresije će se poklopiti sa proračunima u analizi varijanse značajnosti glavnih efekata faktora A I B i efekat interakcije AxB.

Neuravnoteženi i izbalansirani planovi

Prilikom izračunavanja matrice korelacije za sve varijable, kao što su podaci prikazani iznad, primijetit ćete da su glavni efekti faktora A I B i efekat interakcije AxB nekorelirano. Ovo svojstvo efekata naziva se i ortogonalnost. Kažu efekti A I B - ortogonalno ili nezavisni jedno od drugog. Ako su svi efekti u planu ortogonalni jedan prema drugom, kao u gornjem primjeru, tada se kaže da je plan uravnotežen.

Izbalansirani planovi imaju “dobro svojstvo”. Izračuni za analizu takvih planova su vrlo jednostavni. Svi proračuni se svode na izračunavanje korelacije između efekata i zavisnih varijabli. Pošto su efekti ortogonalni, parcijalne korelacije (kao i potpune multidimenzionalni regresije) se ne računaju. Međutim, u stvarnom životu planovi nisu uvijek izbalansirani.

Razmotrimo stvarne podatke sa nejednakim brojem zapažanja u ćelijama.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Ako ove podatke kodiramo kao gore i izračunamo matricu korelacije za sve varijable, otkrićemo da su projektni faktori međusobno povezani. Faktori u planu više nisu ortogonalni i takvi planovi se nazivaju neuravnotežen. Imajte na umu da je u primjeru koji razmatramo korelacija između faktora u potpunosti posljedica razlike u frekvencijama od 1 i -1 u stupcima matrice podataka. Drugim riječima, eksperimentalni dizajn s nejednakim volumenom ćelija (tačnije, nesrazmjernim volumenima) će biti neuravnotežen, što znači da će glavni efekti i interakcije biti zbunjeni. U ovom slučaju, puna multivarijantna regresija mora se izračunati da bi se izračunala statistička značajnost efekata. Ovdje postoji nekoliko strategija.

Zbir kvadrata tipa I, II, III i IV

Zbroj kvadrata tipaIIIII. Da bi se ispitao značaj svakog faktora u multivarijantnom modelu, može se izračunati parcijalna korelacija svakog faktora, pod uslovom da su svi ostali faktori već uzeti u obzir u modelu. Također možete unijeti faktore u model na način korak po korak, hvatajući sve faktore koji su već uneseni u model i zanemarujući sve ostale faktore. Općenito, ovo je razlika između tip III I tipI zbir kvadrata (ova terminologija je uvedena u SAS, vidi, na primjer, SAS, 1982; detaljna rasprava se također može naći u Searle, 1987, str. 461; Woodward, Bonett i Brecht, 1990, str. 216; ili Milliken i Johnson, 1984, str.

Zbroj kvadrata tipaII. Sljedeća „srednja“ strategija formiranja modela sastoji se od: kontrole svih glavnih efekata kada se ispituje značaj jednog glavnog efekta; u kontroli svih glavnih efekata i svih interakcija u paru kada se ispituje značaj pojedinačne interakcije u paru; u kontroli svih glavnih efekata svih interakcija u paru i svih interakcija tri faktora; kada se proučava individualna interakcija tri faktora, itd. Zove se zbroji kvadrata za efekte izračunate na ovaj način tipII zbir kvadrata. dakle, tipII zbir kvadrata kontroliše sve efekte istog i nižeg reda, zanemarujući sve efekte višeg reda.

Zbroj kvadrata tipaIV. Konačno, za neke posebne planove u kojima nedostaju ćelije (nepotpuni planovi) moguće je izračunati tzv. tip IV zbir kvadrata. Ova metoda će biti razmotrena kasnije u vezi sa nekompletnim dizajnom (dizajni sa nedostajućim ćelijama).

Interpretacija hipoteze zbira kvadrata tipa I, II i III

Zbir kvadrata tipIII najlakše protumačiti. Podsjetimo da su zbroji kvadrata tipIII ispitati efekte nakon kontrole svih ostalih efekata. Na primjer, nakon pronalaska statistički značajnog tipIII efekat za faktor A u modulu Analiza varijanse, možemo reći da postoji samo jedan značajan efekat faktora A, nakon što uvedemo sve ostale efekte (faktore) i shodno tome protumačimo ovaj efekat. U vjerovatno 99% svih ANOVA aplikacija, ovo je tip testa za koji je istraživač zainteresiran. Ova vrsta zbira kvadrata se obično izračunava po modulu Analiza varijanse podrazumevano, bez obzira da li je opcija izabrana Regresijski pristup ili ne (standardni pristupi usvojeni u modulu Analiza varijanse diskutovano u nastavku).

Značajni efekti dobiveni korištenjem zbira kvadrata tip ili tipII sume kvadrata nije tako lako protumačiti. Oni se najbolje tumače u kontekstu postupne multivarijantne regresije. Ako, kada se koristi zbir kvadrata tipI glavni efekat faktora B je bio značajan (nakon što je faktor A uključen u model, ali pre nego što je dodata interakcija između A i B), možemo zaključiti da postoji značajan glavni efekat faktora B, pod uslovom da nema interakcije između faktora A i B. (Ako koristite kriterijum tipIII, faktor B se takođe pokazao značajnim, onda možemo zaključiti da postoji značajan glavni efekat faktora B, nakon uvođenja svih ostalih faktora i njihovih interakcija u model).

U smislu hipoteze marginalnih sredstava tipI I tipII obično nemaju jednostavnu interpretaciju. U tim slučajevima se kaže da se značaj efekata ne može tumačiti gledajući samo na marginalna sredstva. Radije predstavljeno str sredstva su povezana sa složenom hipotezom koja kombinuje srednje vrednosti i veličinu uzorka. Na primjer, tipII hipoteze za faktor A u jednostavnom primjeru dizajna 2 x 2 o kojem smo ranije govorili bi bile (vidi Woodward, Bonett i Brecht, 1990, str. 219):

nij- broj posmatranja u ćeliji

uij- prosječna vrijednost u ćeliji

n. j- granični prosjek

Ne ulazeći previše u detalje (za više detalja vidjeti Milliken i Johnson, 1984, Poglavlje 10), jasno je da ovo nisu jednostavne hipoteze i da u većini slučajeva nijedna od njih nije od posebnog interesa za istraživača. Međutim, postoje slučajevi kada hipoteze tipI može biti zanimljivo.

Zadani računski pristup u modulu Analiza varijanse

Podrazumevano ako opcija nije označena Regresijski pristup, modul Analiza varijanse koristi prosječni model ćelije. Karakteristika ovog modela je da se sumi kvadrata za različite efekte izračunavaju za linearne kombinacije srednjih vrednosti ćelija. U punom faktorijalnom eksperimentu, ovo rezultira zbirom kvadrata koji je isti kao zbir kvadrata o kojem se ranije raspravljalo kao tip III. Međutim, u opciji Planirana poređenja(u prozoru Rezultati ANOVA), korisnik može testirati hipotezu u odnosu na bilo koju linearnu kombinaciju ponderiranih ili neponderiranih srednjih vrijednosti ćelije. Dakle, korisnik može testirati ne samo hipoteze tipIII, ali hipoteze bilo koje vrste (uključujući tipIV). Ovaj opšti pristup je posebno koristan kada se ispituju dizajni sa nedostajućim ćelijama (koji se nazivaju nepotpuni dizajni).

Za potpune faktorijalne dizajne, ovaj pristup je također koristan kada se želi analizirati ponderisana marginalna sredina. Na primjer, pretpostavimo da u jednostavnom dizajnu 2 x 2 razmatranom ranije, moramo uporediti ponderisane (prema nivoima faktora B) marginalna sredina za faktor A. Ovo je korisno kada eksperimentator nije pripremio distribuciju zapažanja po ćelijama, već je konstruisana nasumično, a ta slučajnost se odražava u distribuciji broja posmatranja na nivoima faktora B u agregat.

Na primjer, postoji faktor - starost udovice. Mogući uzorak ispitanika podijeljen je u dvije grupe: ispod 40 godina i preko 40 godina (faktor B). Drugi faktor (faktor A) u planu je bio da li su udovice dobile socijalnu podršku od neke agencije (neke su udovice odabrane nasumično, druge su služile kao kontrola). U ovom slučaju, distribucija udovica prema starosti u uzorku odražava stvarnu distribuciju udovica prema starosti u populaciji. Procjena djelotvornosti grupe za socijalnu podršku za udovice svih uzrastaće odgovarati ponderisanom prosjeku za dvije starosne grupe (sa ponderima koji odgovaraju broju zapažanja u grupi).

Planirana poređenja

Imajte na umu da zbir unesenih koeficijenata kontrasta nije nužno jednak 0 (nula). Umjesto toga, program će automatski izvršiti prilagođavanja kako bi osigurao da se odgovarajuće hipoteze ne pomiješaju sa ukupnim prosjekom.

Da bismo to ilustrirali, vratimo se jednostavnom planu 2 x 2 o kojem smo ranije govorili. Podsjetimo da su brojevi opservacija u ćelijama ovog neuravnoteženog dizajna -1, 2, 3 i 1. Pretpostavimo da želimo da uporedimo ponderisane marginalne sredine za faktor A (ponderisane učestalošću nivoa faktora B). Možete unijeti koeficijente kontrasta:

Imajte na umu da se ovi koeficijenti ne zbrajaju do 0. Program će postaviti koeficijente tako da su zbir 0, a njihove relativne vrijednosti će biti sačuvane, tj.:

1/3 2/3 -3/4 -1/4

Ovi kontrasti će uporediti ponderisane sredine za faktor A.

Hipoteze o glavnom prosjeku. Hipoteza da je neponderisana glavna srednja vrednost 0 može se istražiti korišćenjem koeficijenata:

Hipoteza da je ponderisana glavna srednja vrijednost 0 testira se korištenjem:

Program ni u kom slučaju ne prilagođava omjere kontrasta.

Analiza planova sa nedostajućim ćelijama (nepotpuni planovi)

Faktorski dizajni koji sadrže prazne ćelije (obrade kombinacije ćelija koje nemaju zapažanja) nazivaju se nepotpunim. U takvim projektima neki faktori obično nisu ortogonalni i neke interakcije se ne mogu izračunati. Općenito ne postoji bolji metod za analizu takvih planova.

Regresijski pristup

U nekim starijim programima koji se oslanjaju na analizu ANOVA dizajna koristeći multivarijantnu regresiju, faktori u nekompletnom dizajnu su specificirani kao i obično (kao da je dizajn potpun). Multivarijantna regresijska analiza se zatim izvodi na ovim lažno kodiranim faktorima. Nažalost, ova metoda daje rezultate koje je vrlo teško, ako ne i nemoguće, protumačiti jer je nejasno kako svaki efekat doprinosi linearnoj kombinaciji sredstava. Razmotrite sljedeći jednostavan primjer.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Promašen

Ako izvršimo multivarijantnu regresiju oblika Zavisna varijabla = konstanta + faktor A + faktor B, tada hipoteza o značaju faktora A i B u smislu linearnih kombinacija srednjih izgleda ovako:

Faktor A: Ćelija A1,B1 = Ćelija A2,B1

Faktor B: Ćelija A1,B1 = Ćelija A1,B2

Ovaj slučaj je jednostavan. U složenijim projektima nemoguće je zapravo odrediti šta će se tačno ispitivati.

Ćelija znači, ANOVA pristup , Hipoteze tipa IV

Pristup koji se preporučuje u literaturi i koji se čini poželjnijim je proučavanje smisleno (u smislu istraživačkih pitanja) a priori hipoteze o uočenim sredstvima u ćelijama plana. Detaljna rasprava o ovom pristupu može se naći u Dodge (1985), Heiberger (1989), Milliken i Johnson (1984), Searle (1987) ili Woodward, Bonett i Brecht (1990). Zbroji kvadrata povezani s hipotezama o linearnoj kombinaciji srednjih vrijednosti u nekompletnim projektima koji ispituju procjene dijela efekata također se nazivaju sumi kvadrata IV.

Automatsko generiranje hipoteza tipaIV. Kada multivarijantni dizajn ima složene obrasce ćelija koje nedostaju, poželjno je definirati ortogonalne (nezavisne) hipoteze čije je istraživanje ekvivalentno ispitivanju glavnih efekata ili interakcija. Algoritamske (računarske) strategije (bazirane na pseudo-inverznoj matrici dizajna) su razvijene za generisanje odgovarajućih težina za takva poređenja. Nažalost, konačne hipoteze nisu definisane na jedinstven način. Naravno, oni zavise od redosleda u kome su efekti identifikovani i retko dozvoljavaju jednostavnu interpretaciju. Stoga se preporučuje pažljivo proučavanje prirode ćelija koje nedostaju, a zatim formuliranje hipoteza tipIV, koji najsmislenije odgovaraju ciljevima studije. Zatim istražite ove hipoteze koristeći opciju Planirana poređenja u prozoru rezultate. Najlakši način da se specificiraju poređenja u ovom slučaju je da se zahtijeva uvođenje vektora kontrasta za sve faktore zajedno u prozoru Planirana poređenja. Nakon poziva dijalog box-a Planirana poređenja Biće prikazane sve grupe u trenutnom planu, a one koje nedostaju biće označene.

Nedostajuće ćelije i testiranje specifičnog efekta

Postoji nekoliko tipova dizajna u kojima lokacija ćelija koje nedostaju nije nasumična, već je pažljivo planirana, omogućavajući jednostavnu analizu glavnih efekata bez uticaja na druge efekte. Na primjer, kada potreban broj ćelija u planu nije dostupan, planovi se često koriste Latinski kvadrati procijeniti glavne efekte nekoliko faktora sa velikim brojem nivoa. Na primjer, faktorski dizajn 4 x 4 x 4 x 4 zahtijeva 256 ćelija. Istovremeno možete koristiti Grčko-latinski trg za procjenu glavnih efekata sa samo 16 ćelija u dizajnu (pogl Planiranje eksperimenta, tom IV, sadrži detaljan opis takvih planova). Nepotpuni dizajni u kojima se glavni efekti (i neke interakcije) mogu procijeniti korištenjem jednostavnih linearnih kombinacija sredstava nazivaju se izbalansirani nedovršeni planovi.

U balansiranim dizajnima, standardna (podrazumevana) metoda generisanja kontrasta (težina) za glavne efekte i interakcije će zatim proizvesti tabelu analize varijanse u kojoj se zbroji kvadrata za odgovarajuće efekte ne mešaju jedan s drugim. Opcija Specifični efekti prozor rezultateće generirati kontraste koji nedostaju upisivanjem nule u ćelije plana koje nedostaju. Odmah nakon traženja opcije Specifični efekti za korisnika koji ispituje neku hipotezu, pojavljuje se tabela rezultata sa stvarnim težinama. Imajte na umu da se u balansiranom dizajnu zbroji kvadrata odgovarajućih efekata izračunavaju samo ako su ti efekti ortogonalni (nezavisni) u odnosu na sve druge glavne efekte i interakcije. U suprotnom, morate koristiti opciju Planirana poređenja istražiti smislena poređenja između sredstava.

Nedostajuće ćelije i objedinjeni efekti/termini greške

Ako opcija Regresijski pristup na početnoj ploči modula Analiza varijanse nije odabran, model prosječne ćelije će se koristiti prilikom izračunavanja zbira kvadrata za efekte (podrazumevana postavka). Ako dizajn nije uravnotežen, onda kada se kombiniraju neortogonalni efekti (vidi gornju raspravu o opciji Propuštene ćelije i specifičan efekat) može se dobiti zbir kvadrata koji se sastoji od neortogonalnih (ili preklapajućih) komponenti. Dobijeni rezultati se obično ne mogu interpretirati. Stoga treba biti vrlo oprezan pri odabiru i implementaciji složenih nekompletnih eksperimentalnih dizajna.

Postoji mnogo knjiga sa detaljnim raspravama o različitim vrstama planova. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken i Johnson, 1984; Searle, 1987; Woodward i Bonett, 1990), ali ova vrsta informacija je izvan okvira ovog udžbenika. Međutim, analiza različitih tipova planova će biti prikazana kasnije u ovom odeljku.

Pretpostavke i efekti kršenja pretpostavki

Odstupanje od pretpostavke normalnih distribucija

Pretpostavimo da se zavisna varijabla mjeri na numeričkoj skali. Pretpostavimo i da je zavisna varijabla normalno raspoređena unutar svake grupe. Analiza varijanse sadrži širok spektar grafikona i statističkih podataka koji podržavaju ovu pretpostavku.

Efekti poremećaja. Uopšte F test je vrlo robustan na odstupanja od normalnosti (za detaljne rezultate vidi Lindman, 1974). Ako je eksces veći od 0, tada je vrijednost statistike F može postati vrlo mala. Nulta hipoteza je prihvaćena, iako možda nije tačna. Situacija je obrnuta kada je kurtozis manji od 0. Iskrivljenost distribucije obično ima mali uticaj na F statistika. Ako je broj opažanja u ćeliji dovoljno velik, onda odstupanje od normalnosti nije posebno značajno zbog centralna granična teorema, prema kojoj je distribucija prosječne vrijednosti blizu normalne, bez obzira na početnu raspodjelu. Detaljna diskusija o održivosti F statistike se mogu naći u Box i Anderson (1955) ili Lindman (1974).

Ujednačenost varijanse

Pretpostavke. Pretpostavlja se da su varijanse različitih grupa dizajna iste. Ova pretpostavka se zove pretpostavka homogenost varijanse. Podsjetimo da smo na početku ovog odjeljka, kada smo opisivali izračunavanje zbira kvadrata grešaka, izvršili sumiranje unutar svake grupe. Ako se varijanse u dvije grupe razlikuju jedna od druge, onda njihovo zbrajanje nije baš prirodno i ne daje procjenu ukupne varijanse unutar grupe (pošto u ovom slučaju uopće nema ukupne varijanse). Modul Analiza varijanse -ANOVA/MANOVA sadrži veliki skup statističkih kriterijuma za otkrivanje odstupanja od pretpostavki homogenosti varijanse.

Efekti poremećaja. Lindman (1974, str. 33) to pokazuje F kriterijum je prilično stabilan u pogledu kršenja pretpostavki homogenosti varijanse ( heterogenost varijansa, vidi i Box, 1954a, 1954b; Hsu, 1938).

Poseban slučaj: korelacija srednjih vrijednosti i varijansi. Ima trenutaka kada F statistika može obmanuti. Ovo se dešava kada su sredstva projektovanih ćelija u korelaciji sa varijansom. Modul Analiza varijanse omogućava vam da nacrtate dijagrame raspršenja varijanse ili standardne devijacije u odnosu na srednju vrijednost da biste otkrili takvu korelaciju. Razlog zašto je ova korelacija opasna je sljedeći. Zamislimo da je na planu 8 ćelija, od kojih 7 ima skoro isti prosjek, a u jednoj ćeliji je prosjek mnogo veći od ostalih. Onda F test može otkriti statistički značajan efekat. Ali pretpostavimo da je u ćeliji sa velikom prosječnom vrijednošću varijansa znatno veća od ostalih, tj. prosječna vrijednost i varijansa u ćelijama su zavisne (što je veći prosjek, veća je varijansa). U ovom slučaju, veliki prosjek je nepouzdan jer može biti uzrokovan velikom varijacijom u podacima. kako god F statistike zasnovane na ujedinjeni varijansa unutar ćelija će obuhvatiti veliku srednju vrijednost, iako testovi zasnovani na varijansi unutar svake ćelije neće smatrati da su sve razlike u srednjim vrijednostima značajne.

Ova vrsta podataka (velika srednja vrijednost i velika varijansa) se često javlja kada postoje izvanredne opservacije. Jedno ili dva vanjska opažanja uvelike pomjeraju srednju vrijednost i uvelike povećavaju varijansu.

Homogenost varijanse i kovarijanse

Pretpostavke. Multivarijantni dizajn sa multivarijantnim zavisnim mjerama također primjenjuje pretpostavku homogenosti varijanse opisanu ranije. Međutim, budući da postoje multivarijantne zavisne varijable, potrebno je i da njihove međukorelacije (kovarijance) budu ujednačene u svim ćelijama dizajna. Modul Analiza varijanse nudi različite načine testiranja ovih pretpostavki.

Efekti poremećaja. Multidimenzionalni analog F- kriterij - Wilksov λ-test. Ne zna se mnogo o robusnosti Wilksovog λ testa s obzirom na kršenje gornjih pretpostavki. Međutim, budući da je interpretacija rezultata modula Analiza varijanse se obično zasniva na značajnosti univarijantnih efekata (nakon utvrđivanja značaja opšteg kriterijuma), rasprava o robusnosti se uglavnom odnosi na univarijantnu analizu varijanse. Stoga, značaj univarijantnih efekata treba pažljivo ispitati.

Poseban slučaj: analiza kovarijanse. Naročito teška kršenja homogenosti varijanse/kovarijance mogu nastati kada su kovarijate uključene u dizajn. Konkretno, ako se korelacija između kovarijati i zavisnih mjera razlikuje po ćelijama u dizajnu, može doći do pogrešnog tumačenja rezultata. Zapamtite da analiza kovarijanse u suštini izvodi regresijsku analizu unutar svake ćelije kako bi se izolirao onaj dio varijanse koji je obuhvaćen kovarijantom. Pretpostavka homogenosti varijanse/kovarijance pretpostavlja da se ova regresiona analiza provodi pod sljedećim ograničenjem: sve regresione jednadžbe (nagibi) za sve ćelije su iste. Ako se to ne pretpostavi, mogu se pojaviti velike greške. Modul Analiza varijanse ima nekoliko posebnih kriterijuma za testiranje ove pretpostavke. Preporučljivo je koristiti ove kriterije kako bi se osiguralo da su jednadžbe regresije za različite ćelije približno iste.

Sferičnost i kompleksna simetrija: razlozi za korištenje multivarijantnog pristupa ponovljenim mjerama u analizi varijanse

U dizajnu koji sadrži faktore ponovljenih mjerenja sa više od dva nivoa, upotreba univarijantne ANOVA zahtijeva dodatne pretpostavke: pretpostavku složene simetrije i pretpostavku sferičnosti. Ove pretpostavke se rijetko ispunjavaju (vidi dolje). Zbog toga je posljednjih godina multivarijantna analiza varijanse postala popularna u takvim dizajnima (oba pristupa se kombiniraju u modulu Analiza varijanse).

Pretpostavka kompleksne simetrije Pretpostavka složene simetrije je da su varijanse (dijeljene unutar grupa) i kovarijanse (dijeljene unutar grupa) za različite ponovljene mjere homogene (iste). Ovo je dovoljan uslov da bi univarijantni F test za ponovljene mjere bio validan (tj. prijavljene F vrijednosti su u prosjeku konzistentne sa F distribucijom). Međutim, u ovom slučaju ovaj uslov nije neophodan.

Pretpostavka sferičnosti. Pretpostavka sferičnosti je neophodan i dovoljan uslov da bi F-test bio validan. Sastoji se u tome da su unutar grupa sva opažanja nezavisna i ravnomjerno raspoređena. Priroda ovih pretpostavki i uticaj njihovog kršenja obično nisu dobro opisani u knjigama o ANOVA-i - to će biti objašnjeno u sljedećim paragrafima. Također će se pokazati da se rezultati univarijatnog pristupa mogu razlikovati od rezultata multivarijatnog pristupa, te će biti objašnjeno što to znači.

Potreba za nezavisnošću hipoteza. Opšti način analize podataka u ANOVA je uklapanje modela. Ako, u odnosu na model koji odgovara podacima, postoje neki a priori hipoteze, onda se varijansa dijeli kako bi se testirale ove hipoteze (kriterijumi za glavne efekte, interakcije). Sa računske tačke gledišta, ovaj pristup generiše skup kontrasta (skup poređenja planskih sredstava). Međutim, ako kontrasti nisu nezavisni jedan od drugog, podjela varijansi postaje besmislena. Na primjer, ako su dva kontrasta A I B su identične i odgovarajući dio varijanse se izdvaja, zatim se isti dio izdvaja dva puta. Na primjer, glupo je i besmisleno identificirati dvije hipoteze: “srednja vrijednost u ćeliji 1 je veća od prosjeka u ćeliji 2” i “srednja vrijednost u ćeliji 1 je veća od srednje vrijednosti u ćeliji 2”. Dakle, hipoteze moraju biti nezavisne ili ortogonalne.

Nezavisne hipoteze u ponovljenim mjerama. Opšti algoritam implementiran u modulu Analiza varijanse, pokušaće da generiše nezavisne (ortogonalne) kontraste za svaki efekat. Za faktor ponovljenih mjerenja, ovi kontrasti daju mnoge hipoteze o razlike između nivoa faktora koji se razmatra. Međutim, ako su ove razlike u korelaciji unutar grupa, onda nastali kontrasti više nisu nezavisni. Na primjer, u nastavi gdje se studenti mjere tri puta u jednom semestru, može se desiti da je promjena između 1. i 2. mjerenja u negativnoj korelaciji sa promjenom između 2. i 3. mjerenja predmeta. Oni koji su savladali većinu gradiva između 1. i 2. dimenzije, savladavaju manji dio tokom vremena koje je prošlo između 2. i 3. dimenzije. Zapravo, za većinu slučajeva gdje se ANOVA koristi za ponovljene mjere, može se pretpostaviti da su promjene između nivoa povezane među subjektima. Međutim, kada se to dogodi, pretpostavka kompleksne simetrije i pretpostavka sferičnosti ne vrijede i nezavisni kontrasti se ne mogu izračunati.

Utjecaj kršenja i načini za njihovo ispravljanje. Kada složene pretpostavke simetrije ili sferičnosti nisu ispunjene, ANOVA može dati pogrešne rezultate. Prije nego što su multivarijantne procedure dovoljno razvijene, predloženo je nekoliko pretpostavki za kompenzaciju kršenja ovih pretpostavki. (Vidi, na primjer, Greenhouse & Geisser, 1959. i Huynh & Feldt, 1970.). Ove metode su još uvijek u širokoj primjeni (zbog čega su predstavljene u modulu Analiza varijanse).

Multivarijantna analiza varijansnog pristupa ponovljenim mjerama. Generalno, problemi kompleksne simetrije i sferičnosti odnose se na činjenicu da skupovi kontrasta uključeni u proučavanje efekata faktora ponovljenih mjerenja (sa više od 2 nivoa) nisu nezavisni jedan od drugog. Međutim, ne moraju biti neovisni ako se koriste multidimenzionalni test za istovremeno testiranje statističke značajnosti dva ili više ponovljenih mjerenja faktora kontrasta. To je razlog zašto se multivarijantna analiza tehnika varijanse sve više koristi za testiranje značajnosti faktora univarijantnih ponovljenih mjera sa više od 2 nivoa. Ovaj pristup je široko prihvaćen jer općenito ne zahtijeva složenu simetriju ili sferičnost.

Slučajevi u kojima se ne može koristiti multivarijantna analiza varijansnog pristupa. Postoje primjeri (projekti) u kojima se ne može primijeniti multivarijantna analiza varijansnog pristupa. To su tipični slučajevi kada postoji mali broj subjekata u dizajnu i mnogo nivoa u faktoru ponovljenih mjerenja. Tada može biti premalo zapažanja da bi se izvršila multivarijantna analiza. Na primjer, ako postoji 12 subjekata, str = 4 faktor ponovljenih mjerenja, a svaki faktor ima k = 3 nivoa. Tada će interakcija 4 faktora “potrošiti” (k-1)P = 2 4 = 16 stepena slobode. Međutim, postoji samo 12 subjekata, tako da se multivarijantni test ne može izvesti u ovom primjeru. Modul Analiza varijanseće nezavisno otkriti ova zapažanja i izračunati samo jednodimenzionalne kriterijume.

Razlike u univarijantnim i multivarijantnim rezultatima. Ako studija uključuje veliki broj ponovljenih mjera, mogu postojati slučajevi u kojima pristup ANOVA s univarijantnim ponovljenim mjerama daje rezultate koji se vrlo razlikuju od onih dobivenih multivarijantnim pristupom. To znači da su razlike između nivoa odgovarajućih ponovljenih mjera u korelaciji između subjekata. Ponekad je ova činjenica od nekog nezavisnog interesa.

Multivarijantna analiza varijanse i modeliranje strukturnih jednačina

Posljednjih godina, modeliranje strukturnih jednačina postalo je popularno kao alternativa multivarijantnoj analizi varijanse (vidi, na primjer, Bagozzi i Yi, 1989; Bagozzi, Yi i Singh, 1991; Cole, Maxwell, Arvey i Salas, 1993) . Ovaj pristup omogućava testiranje hipoteza ne samo o srednjim vrijednostima u različitim grupama, već io matricama korelacije zavisnih varijabli. Na primjer, moglo bi se ublažiti pretpostavke o homogenosti varijansi i kovarijansi i eksplicitno uključiti varijanse greške i kovarijanse u model za svaku grupu. Modul STATISTICAModeliranje strukturne jednačine (SEPATH) (vidi Tom III) dozvoljava takvu analizu.

Korištenje statistike u ovoj bilješci će biti ilustrovano unakrsnim primjerom. Recimo da ste menadžer proizvodnje u kompaniji Perfect Parachute. Padobrani su napravljeni od sintetičkih vlakana koje isporučuju četiri različita dobavljača. Jedna od glavnih karakteristika padobrana je njegova snaga. Morate osigurati da sva isporučena vlakna budu iste čvrstoće. Da bi se odgovorilo na ovo pitanje, trebalo bi osmisliti eksperimentalni dizajn za mjerenje snage padobrana tkanih od sintetičkih vlakana različitih dobavljača. Informacije dobijene iz ovog eksperimenta će odrediti koji dobavljač nudi najizdržljivije padobrane.

Mnoge aplikacije uključuju eksperimente koji razmatraju više grupa ili nivoa jednog faktora. Neki faktori, kao što je temperatura pečenja keramike, mogu imati više numeričkih nivoa (tj. 300°, 350°, 400° i 450°). Drugi faktori, kao što je lokacija artikala u supermarketu, mogu imati kategoričke nivoe (npr. prvi dobavljač, drugi dobavljač, treći dobavljač, četvrti dobavljač). Eksperimenti sa jednim faktorom u kojima su eksperimentalne jedinice nasumično dodijeljene grupama ili nivoima faktora nazivaju se potpuno randomizirani.

UpotrebaF-kriterijumi za procjenu razlika između nekoliko matematičkih očekivanja

Ako su numerička mjerenja faktora u grupama kontinuirana i neki dodatni uvjeti su ispunjeni, analiza varijanse (ANOVA) se koristi za poređenje matematičkih očekivanja nekoliko grupa. An alysis o f Va riance). Analiza varijanse korištenjem potpuno randomiziranih dizajna naziva se jednosmjerna ANOVA procedura. Na neki način, termin analiza varijanse je pogrešan naziv jer uspoređuje razlike između očekivanih vrijednosti grupa, a ne između varijansi. Međutim, poređenje matematičkih očekivanja vrši se upravo na osnovu analize varijacije podataka. U ANOVA proceduri, ukupna varijacija u rezultatima mjerenja podijeljena je na između grupa i unutar grupa (slika 1). Varijacije unutar grupe se objašnjavaju eksperimentalnom greškom, a varijacije između grupa se objašnjavaju efektima eksperimentalnih uslova. Simbol With označava broj grupa.

Rice. 1. Particioniranje varijacije u potpuno randomiziranom eksperimentu

Preuzmite bilješku u formatu ili, primjere u formatu

Pretvarajmo se to With grupe se izdvajaju iz nezavisnih populacija koje imaju normalnu distribuciju i jednaku varijansu. Nul hipoteza je da su matematička očekivanja populacije ista: H 0: μ 1 = μ 2 = ... = μ s. Alternativna hipoteza kaže da nisu sva matematička očekivanja ista: H 1: nisu svi μ j isti j= 1, 2, …, s).

Na sl. Slika 2 predstavlja pravu nultu hipotezu o matematičkim očekivanjima pet upoređenih grupa, pod uslovom da populacije imaju normalnu distribuciju i istu varijansu. Pet populacija povezanih sa različitim nivoima faktora su identične. Posljedično, oni su superponirani jedan na drugi, imaju ista matematička očekivanja, varijaciju i oblik.

Rice. 2. Pet općih populacija ima ista matematička očekivanja: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

S druge strane, pretpostavimo da je zapravo nulta hipoteza pogrešna, pri čemu četvrti nivo ima najveću očekivanu vrijednost, prvi nivo ima nešto nižu očekivanu vrijednost, a preostali nivoi imaju iste, pa čak niže očekivane vrijednosti ( Slika 3). Imajte na umu da je, sa izuzetkom očekivanih vrijednosti, svih pet populacija identičnih (odnosno, imaju istu varijabilnost i oblik).

Rice. 3. Uočava se efekat eksperimentalnih uslova: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

Prilikom testiranja hipoteze o jednakosti matematičkih očekivanja nekoliko općih populacija, ukupna varijacija se dijeli na dva dijela: međugrupna varijacija, zbog razlika među grupama, i unutargrupna varijacija, zbog razlika između elemenata koji pripadaju istoj grupi. Ukupna varijacija se izražava ukupnim zbirom kvadrata (SST – zbir kvadrata). Pošto je nulta hipoteza da su matematička očekivanja svih With grupe su jednake jedna drugoj, ukupna varijacija je jednaka zbiru kvadrata razlika između pojedinačnih opažanja i ukupnog prosjeka (prosjeka prosjeka), izračunatog za sve uzorke. Potpuna varijacija:

Gdje - opšti prosek, X ij - i-e posmatranje u j-grupa ili nivo, n j- broj zapažanja u j ta grupa, n- ukupan broj zapažanja u svim grupama (tj. n = n 1 + n 2 + … + n c), With- broj proučavanih grupa ili nivoa.

Varijacije između grupa, koji se obično naziva zbir kvadrata između grupe (SSA - zbir kvadrata među grupama), jednak je zbiru kvadrata razlika između srednje vrijednosti uzorka svake grupe j i ukupni prosjek , pomnoženo sa zapreminom odgovarajuće grupe n j:

Gdje With- broj proučavanih grupa ili nivoa, n j- broj zapažanja u j ta grupa, j- prosječna vrijednost j ta grupa, - ukupan prosek.

Varijacije unutar grupe, koji se obično naziva zbir kvadrata unutar grupe (SSW - zbir kvadrata unutar grupa), jednak je zbiru kvadrata razlika između elemenata svake grupe i srednje vrijednosti uzorka ove grupe j:

Gdje Xij - i th element j ta grupa, j- prosječna vrijednost j th group.

Pošto se upoređuju With nivoi faktora, međugrupni zbir kvadrata ima s – 1 stepena slobode. Svaki od With nivoa ima n j – 1 stepena slobode, tako da unutargrupni zbir kvadrata ima n- Sa stepena slobode, i

Osim toga, ukupan zbir kvadrata ima n – 1 stepena slobode, od svakog posmatranja Xij se upoređuje sa ukupnim prosjekom izračunatim za sve n zapažanja. Ako se svaki od ovih zbroja podijeli s odgovarajućim brojem stupnjeva slobode, nastaju tri vrste disperzije: međugrupa(srednji kvadrat među - MSA), unutargrupa(srednji kvadrat unutar - MSW) i pun(srednji kvadratni ukupni - MST):

Uprkos činjenici da je glavna svrha analize varijanse da uporedi matematička očekivanja With grupe u cilju identifikacije uticaja eksperimentalnih uslova, naziv je dobio zbog činjenice da je glavni alat analiza varijansi različitih tipova. Ako je nulta hipoteza tačna, i između matematičkih očekivanja With grupe nema značajnih razlika, sve tri varijanse - MSA, MSW i MST - su procjene varijanse σ 2 svojstvene analiziranim podacima. Dakle, za testiranje nulte hipoteze H 0: μ 1 = μ 2 = ... = μ s i alternativne hipoteze H 1: nisu svi μ j isti j = 1, 2, …, With), potrebno je izračunati statistiku F-kriterijum, koji predstavlja omjer dvije varijanse, MSA i MSW. Test F-statistika u jednosmjernoj analizi varijanse

Statistika F-u zavisnosti od kriterijuma F-distribucija sa s – 1 stepena slobode u brojiocu M.S.A. I n – s stepena slobode u nazivniku M.S.W.. Za dati nivo značajnosti α, nulta hipoteza se odbacuje ako se izračuna F FU, inherentno F-distribucija sa s – 1 n – s stepena slobode u nazivniku. Dakle, kao što je prikazano na sl. 4, pravilo odlučivanja je formulirano na sljedeći način: nulta hipoteza H 0 odbijeno ako F>FU; inače se ne odbija.

Rice. 4. Kritična oblast analize varijanse pri testiranju hipoteze H 0

Ako je nulta hipoteza H 0 je tačno, izračunato F-statistika je blizu 1, pošto su njen brojilac i imenilac procene iste veličine – disperzije σ2 svojstvene analiziranim podacima. Ako je nulta hipoteza H 0 je lažna (i postoji značajna razlika između matematičkih očekivanja različitih grupa), izračunato F-statistika će biti mnogo veća od jedinice jer njen brojilac, MSA, procjenjuje, osim prirodne varijabilnosti podataka, i učinak eksperimentalnih uvjeta ili razliku između grupa, dok imenilac MSW procjenjuje samo prirodnu varijabilnost podataka . Dakle, ANOVA postupak je F-kriterijum u kojem se, na datom nivou značajnosti α, nulta hipoteza odbacuje ako je izračunata F-statistika je veća od gornje kritične vrijednosti FU, inherentno F-distribucija sa s – 1 stepeni slobode u brojiocu i n – s stepena slobode u nazivniku, kao što je prikazano na sl. 4.

Da bismo ilustrirali jednosmjernu analizu varijanse, vratimo se scenariju koji je naveden na početku napomene. Svrha eksperimenta je utvrditi da li padobrani tkani od sintetičkih vlakana dobivenih od različitih dobavljača imaju istu snagu. Svaka grupa ima pet padobrana. Grupe su podijeljene po dobavljačima - dobavljač 1, dobavljač 2, dobavljač 3 i dobavljač 4. Snaga padobrana se mjeri pomoću posebnog uređaja koji testira tkaninu na kidanje sa obje strane. Sila potrebna za razbijanje padobrana mjeri se na posebnoj skali. Što je veća sila loma, to je padobran jači. Excel vam omogućava analizu F-statistika jednim klikom. Prođite kroz meni PodaciAnaliza podataka i izaberite liniju Jednosmjerna ANOVA, popunite prozor koji se otvori (slika 5). Eksperimentalni rezultati (prekidna čvrstoća), neke deskriptivne statistike i rezultati jednosmjerne analize varijanse prikazani su na Sl. 6.

Rice. 5. Prozor Jednosmjerna analiza paketa analize varijanse Excel

Rice. 6. Pokazatelji čvrstoće padobrana tkanih od sintetičkih vlakana dobijenih od različitih dobavljača, deskriptivna statistika i rezultati jednosmjerne analize varijanse

Analiza slike 6 pokazuje da postoji određena razlika između srednjih vrijednosti uzorka. Prosječna čvrstoća vlakana dobijenih od prvog dobavljača je 19,52, od drugog - 24,26, od trećeg - 22,84 i od četvrtog - 21,16. Da li je ova razlika statistički značajna? Raspodjela sile loma prikazana je na dijagramu raspršenja (slika 7). To jasno pokazuje razlike između i unutar grupa. Ako bi svaka grupa bila veća, za njihovu analizu bi se mogao koristiti dijagram stabljike i lista, dijagram kutije ili dijagram zvona.

Rice. 7. Dijagram disperzije čvrstoće za padobrane tkane od sintetičkih vlakana dobijenih od četiri dobavljača.

Nul hipoteza kaže da nema značajnih razlika između prosječnih rezultata snage: H 0: μ 1 = μ 2 = μ 3 = μ 4. Alternativna hipoteza je da postoji barem jedan dobavljač čija se prosječna snaga vlakana razlikuje od ostalih: H 1: nisu svi μ j isti ( j = 1, 2, …, With).

Ukupan prosek (vidi sliku 6) = PROSEK (D12:D15) = 21,945; da biste odredili, takođe možete usredsrediti svih 20 originalnih brojeva: = PROSEK (A3:D7). Izračunavaju se vrijednosti varijanse Paket analiza i odražavaju se u ploči Analiza varijanse(vidi sliku 6): SSA = 63,286, SSW = 97,504, SST = 160,790 (vidi kolonu SS stolovi Analiza varijanse Slika 6). Prosjeci se izračunavaju dijeljenjem ovih zbira kvadrata sa odgovarajućim brojem stupnjeva slobode. Zbog With= 4, a n= 20, dobijamo sledeće vrednosti stepena slobode; za SSA: s – 1= 3; za SSW: n–c= 16; za SST: n – 1= 19 (vidi kolonu df). Dakle: MSA = SSA / ( s – 1)= 21.095; MSW = SSW / ( n–c) = 6.094; MST = SST / ( n – 1) = 8,463 (vidi kolonu GOSPOĐA). F-statistika = MSA / MSW = 3,462 (vidi kolonu F).

Gornja kritična vrijednost FU, karakteristika F-distribucija, određena formulom =F.OBR(0,95;3;16) = 3,239. Parametri funkcije =F.OBR(): α = 0,05, brojilac ima tri stepena slobode, a imenilac 16. Dakle, izračunato F-statistika jednaka 3,462 premašuje gornju kritičnu vrijednost FU= 3,239, nulta hipoteza se odbacuje (slika 8).

Rice. 8. Kritična oblast analize varijanse na nivou značajnosti 0,05 ako brojilac ima tri stepena slobode, a imenilac -16

R-vrijednost, tj. vjerovatnoća da je nulta hipoteza tačna F-statistiku ne manje od 3,46, jednako 0,041 ili 4,1% (vidi kolonu p-vrijednost stolovi Analiza varijanse Slika 6). Pošto ova vrijednost ne prelazi nivo značajnosti α = 5%, nulta hipoteza se odbacuje. Štaviše, R-vrijednost pokazuje da je vjerovatnoća otkrivanja takve ili veće razlike između matematičkih očekivanja općih populacija, pod uslovom da su ona u stvari ista, jednaka 4,1%.

Dakle. Postoji razlika između četiri srednje vrijednosti uzorka. Nul hipoteza je bila da su sva matematička očekivanja četiri populacije jednaka. Pod ovim uslovima, mera ukupne varijabilnosti (tj. ukupne SST varijacije) snage svih padobrana se izračunava zbrajanjem kvadrata razlika između svakog posmatranja X ij i ukupni prosjek . Ukupna varijacija je zatim razdvojena na dvije komponente (vidi sliku 1). Prva komponenta je bila varijacija između grupa u SSA, a druga je bila varijacija unutar grupe u SSW.

Šta objašnjava varijabilnost u podacima? Drugim riječima, zašto sva zapažanja nisu ista? Jedan od razloga je taj što različite kompanije isporučuju vlakna različite jačine. Ovo delimično objašnjava zašto grupe imaju različita matematička očekivanja: što je jači efekat eksperimentalnih uslova, veća je razlika između matematičkih očekivanja grupa. Drugi razlog za varijabilnost podataka je prirodna varijabilnost bilo kojeg procesa, u ovom slučaju proizvodnje padobrana. Čak i da su sva vlakna kupljena od istog dobavljača, njihova snaga ne bi bila ista, pod uslovom da su sve ostale jednake. Budući da se ovaj efekat javlja unutar svake grupe, naziva se varijacija unutar grupe.

Razlike između srednjih vrijednosti uzorka nazivaju se međugrupna varijacija SSA. Dio varijacija unutar grupe, kao što je već naznačeno, objašnjava se pripadnosti podataka različitim grupama. Međutim, čak i da su grupe potpuno iste (tj. nulta hipoteza je tačna), varijacije između grupa bi i dalje postojale. Razlog tome je prirodna varijabilnost procesa proizvodnje padobrana. Budući da su uzorci različiti, njihova se vrijednost uzorka razlikuju jedna od druge. Stoga, ako je nulta hipoteza tačna, i varijabilnost između i unutar grupe predstavlja procjenu varijabilnosti populacije. Ako je nulta hipoteza netačna, hipoteza između grupa će biti veća. Ova činjenica je u osnovi F-kriterijumi za poređenje razlika između matematičkih očekivanja nekoliko grupa.

Nakon izvršenja jednosmjerne ANOVA i pronalaženja značajne razlike između firmi, ostaje nepoznato koji dobavljač se značajno razlikuje od ostalih. Znamo samo da matematička očekivanja opće populacije nisu jednaka. Drugim riječima, barem jedno od matematičkih očekivanja značajno se razlikuje od ostalih. Da biste utvrdili koji se dobavljač razlikuje od ostalih, možete koristiti Tukey procedura, koristeći poređenje u paru između dobavljača. Ovu proceduru je razvio John Tukey. Nakon toga, on i K. Kramer su nezavisno modifikovali ovu proceduru za situacije u kojima se veličine uzoraka razlikuju jedna od druge.

Višestruko poređenje: Tukey-Kramerova procedura

U našem scenariju, jednosmjerna analiza varijanse korištena je za poređenje snage padobrana. Nakon što su utvrđene značajne razlike između matematičkih očekivanja četiri grupe, potrebno je utvrditi koje se grupe međusobno razlikuju. Iako postoji nekoliko načina za rješavanje ovog problema, opisati ćemo samo Tukey-Kramerov postupak višestrukog poređenja. Ova metoda je primjer post hoc procedura poređenja jer se hipoteza koja se testira formuliše nakon analize podataka. Tukey-Kramerova procedura omogućava da se svi parovi grupa uporede istovremeno. U prvoj fazi se izračunavaju razlike Xj -Xj, Gdje j ≠j, između matematičkih očekivanja s(s – 1)/2 grupe. Kritički opseg Tukey-Kramerov postupak se izračunava po formuli:

Gdje Q U- gornja kritična vrijednost studentizovane raspodjele raspona, koja ima With stepena slobode u brojiocu i n - Sa stepena slobode u nazivniku.

Ako veličine uzorka nisu iste, kritični raspon se izračunava za svaki par matematičkih očekivanja posebno. U posljednjoj fazi, svaki od s(s – 1)/2 parovi matematičkih očekivanja se porede sa odgovarajućim kritičnim opsegom. Elementi para se smatraju značajno različitim ako je modul razlike | Xj -Xj| između njih prelazi kritični raspon.

Primijenimo Tukey-Kramerov postupak na problem snage padobrana. Pošto padobranska kompanija ima četiri dobavljača, potrebno je provjeriti 4(4 – 1)/2 = 6 parova dobavljača (slika 9).

Rice. 9. Parna poređenja srednjih vrijednosti uzorka

Pošto sve grupe imaju isti volumen (tj n j = n j), dovoljno je izračunati samo jedan kritični raspon. Da biste to učinili, prema tabeli ANOVA(slika 6) određujemo vrijednost MSW = 6,094. Zatim nalazimo vrijednost Q U pri α = 0,05, With= 4 (broj stepena slobode u brojiocu) i n- Sa= 20 – 4 = 16 (broj stepena slobode u nazivniku). Nažalost, nisam našao odgovarajuću funkciju u Excelu, pa sam koristio tabelu (slika 10).

Rice. 10. Kritična vrijednost studentiziranog raspona Q U

Dobijamo:

Pošto je samo 4,74 > 4,47 (vidi donju tabelu na slici 9), postoji statistički značajna razlika između prvog i drugog dobavljača. Svi ostali parovi imaju uzorke koji nam ne dozvoljavaju da govorimo o njihovim razlikama. Posljedično, prosječna čvrstoća padobrana tkanih od vlakana kupljenih od prvog dobavljača znatno je manja od one kod drugog.

Neophodni uslovi za jednosmernu analizu varijanse

Prilikom rješavanja problema jačine padobrana nismo provjerili da li su uvjeti pod kojima je moguće koristiti jednofaktorski F-kriterijum. Kako znate da li možete koristiti jedan faktor F-kriterijum pri analizi konkretnih eksperimentalnih podataka? Jedan faktor F-kriterijum se može primijeniti samo ako su ispunjene tri osnovne pretpostavke: eksperimentalni podaci moraju biti slučajni i nezavisni, imati normalnu distribuciju, a njihove varijanse moraju biti jednake.

Prva pretpostavka - slučajnost i nezavisnost podataka- mora se uvijek izvoditi, jer ispravnost svakog eksperimenta zavisi od slučajnosti izbora i/ili procesa randomizacije. Da bi se izbjeglo pristrasnost rezultata, potrebno je da se podaci izvuku iz With opšte populacije nasumično i nezavisno jedna od druge. Slično, podaci bi trebali biti nasumično raspoređeni With nivoi faktora koji nas zanima (eksperimentalne grupe). Kršenje ovih uslova može ozbiljno poremetiti rezultate analize varijanse.

Drugo nagađanje - normalnost- znači da su podaci izvučeni iz normalno raspoređenih populacija. Kao za t-kriterijumi, jednosmjerna analiza varijanse na osnovu F-kriterijum je relativno malo osjetljiv na kršenje ovog stanja. Ako distribucija ne odstupa previše značajno od normalne, nivo značajnosti F-kriterijum se malo mijenja, posebno ako je veličina uzorka dovoljno velika. Ako je uslov normalnosti distribucije ozbiljno narušen, treba ga primijeniti.

Treća pretpostavka - homogenost varijanse- znači da su varijanse svake populacije jednake jedna drugoj (tj. σ 1 2 = σ 2 2 = ... = σ j 2). Ova pretpostavka omogućava da se odluči hoće li odvojiti ili objediniti varijanse unutar grupe. Ako su veličine grupa iste, uslov homogenosti varijanse ima mali uticaj na zaključke dobijene korišćenjem F-kriterijumi. Međutim, ako su veličine uzorka nejednake, kršenje uvjeta jednakosti varijansi može ozbiljno iskriviti rezultate analize varijanse. Stoga treba uložiti napore da se osigura da su veličine uzoraka jednake. Jedna od metoda za provjeru pretpostavke homogenosti varijanse je kriterij Levene opisano u nastavku.

Ako je od sva tri uslova prekršen samo uslov homogenosti varijanse, postupak sličan t-kriterijum koji koristi odvojenu varijansu (za više detalja pogledajte). Međutim, ako se istovremeno naruše pretpostavke normalne distribucije i homogenosti varijanse, potrebno je normalizirati podatke i smanjiti razlike između varijansi ili primijeniti neparametarski postupak.

Levenov test za ispitivanje homogenosti varijanse

Iako F-kriterijum je relativno otporan na narušavanje uslova jednakosti varijansi u grupama, grubo kršenje ove pretpostavke značajno utiče na nivo značajnosti i snage kriterijuma. Možda je jedan od najmoćnijih kriterija Levene. Za provjeru jednakosti varijansi With opće populacije, testirat ćemo sljedeće hipoteze:

N 0: σ 1 2 = σ 2 2 = … = σj 2

H 1: Ne sve σ j 2 su isti ( j = 1, 2, …, With)

Modificirani Levenov test temelji se na tvrdnji da ako je varijabilnost u grupama ista, analiza varijanse u apsolutnim vrijednostima razlika između opažanja i medijana grupe može se koristiti za testiranje nulte hipoteze o jednakosti varijansi. Dakle, prvo biste trebali izračunati apsolutne vrijednosti razlika između opažanja i medijana u svakoj grupi, a zatim izvršiti jednosmjernu analizu varijanse na rezultirajućim apsolutnim vrijednostima razlika. Da bismo ilustrovali Levenov kriterijum, vratimo se scenariju iznetom na početku beleške. Koristeći podatke prikazane na sl. 6, sprovešćemo sličnu analizu, ali u odnosu na module razlika u početnim podacima i medijanima za svaki uzorak posebno (Sl. 11).

Najnoviji materijali u sekciji:

Anna Ioannovna.  Život i vlada.  Zbacivanje Birona.  Biografija carice Ane Joanovne Vladavina Ane Joanovne
Anna Ioannovna. Život i vlada. Zbacivanje Birona. Biografija carice Ane Joanovne Vladavina Ane Joanovne

Rođen u Moskvi 8. februara (28. januara po starom stilu) 1693. godine. Bila je srednja ćerka cara Ivana Aleksejeviča i Praskovje Fjodorovne...

Jermenske bajke preuzmite Heroji armenskih narodnih priča
Jermenske bajke preuzmite Heroji armenskih narodnih priča

Jermenske bajke © 2012 Izdavačka kuća “Sedma knjiga”. Prevod, kompilacija i uređivanje. Sva prava zadržana. Nije dio elektronske verzije ovog...

Biološka uloga vode u ćeliji Kakvu ulogu igra voda u životu ćelije?
Biološka uloga vode u ćeliji Kakvu ulogu igra voda u životu ćelije?

Visok sadržaj vode u ćeliji je najvažniji uslov za njenu aktivnost. Gubitkom većine vode mnogi organizmi umiru, a veliki broj jednoćelijskih i...