დისპერსიის ანალიზი. კურსის მუშაობა: ვარიანტების ანალიზი დისპერსიის მრავალვარიანტული ანალიზი

ვარიაციის ანალიზი არის სტატისტიკური მეთოდების ერთობლიობა, რომელიც შექმნილია ჰიპოთეზების შესამოწმებლად გარკვეულ მახასიათებლებსა და შესწავლილ ფაქტორებს შორის ურთიერთობის შესახებ, რომლებსაც არ აქვთ რაოდენობრივი აღწერა, აგრეთვე ფაქტორების გავლენის ხარისხისა და მათი ურთიერთქმედების დასადგენად. სპეციალიზებულ ლიტერატურაში მას ხშირად უწოდებენ ANOVA-ს (ინგლისური სახელწოდებიდან Analysis of Variations). ეს მეთოდი პირველად რ.ფიშერმა 1925 წელს შეიმუშავა.

ვარიაციის ანალიზის სახეები და კრიტერიუმები

ეს მეთოდი გამოიყენება თვისებრივი (ნომინალური) მახასიათებლებისა და რაოდენობრივი (უწყვეტი) ცვლადის კავშირის შესასწავლად. არსებითად, ის ამოწმებს ჰიპოთეზას რამდენიმე ნიმუშის არითმეტიკული საშუალებების ტოლობის შესახებ. ამრიგად, ის შეიძლება ჩაითვალოს პარამეტრულ კრიტერიუმად რამდენიმე ნიმუშის ცენტრის ერთდროულად შესადარებლად. თუ ეს მეთოდი გამოიყენება ორ ნიმუშზე, დისპერსიული ანალიზის შედეგები იდენტური იქნება Student-ის t-ტესტის შედეგებისა. თუმცა, სხვა კრიტერიუმებისგან განსხვავებით, ეს კვლევა პრობლემის უფრო დეტალურად შესწავლის საშუალებას გვაძლევს.

სტატისტიკაში დისპერსიული ანალიზი ეფუძნება კანონს: გაერთიანებული ნიმუშის კვადრატული გადახრების ჯამი უდრის კვადრატულ შიდაჯგუფურ გადახრებს და კვადრატულ ჯგუფთაშორის გადახრების ჯამს. კვლევა იყენებს ფიშერის ტესტს ჯგუფთაშორის და ჯგუფურ დისპერსიებს შორის სხვაობის მნიშვნელობის დასადგენად. თუმცა, ამის აუცილებელი წინაპირობაა ნიმუშების განაწილების ნორმალურობა და ჰომოსკედასტურობა (ვარიანტების თანასწორობა). არსებობს ცვალებადობის უნივარიატიული (ერთფაქტორიანი) და მრავალვარიანტული (მულტიფაქტორული) ანალიზი. პირველი განიხილავს შესასწავლი ღირებულების დამოკიდებულებას ერთ მახასიათებელზე, მეორე - ბევრზე ერთდროულად და ასევე გვაძლევს საშუალებას დავადგინოთ კავშირი მათ შორის.

ფაქტორები

ფაქტორები არის კონტროლირებადი გარემოებები, რომლებიც გავლენას ახდენენ საბოლოო შედეგზე. მისი დონე ან დამუშავების მეთოდი არის მნიშვნელობა, რომელიც ახასიათებს ამ მდგომარეობის სპეციფიკურ გამოვლინებას. ეს რიცხვები, როგორც წესი, წარმოდგენილია ნომინალური ან რიგითი გაზომვის შკალაზე. ხშირად გამომავალი მნიშვნელობები იზომება რაოდენობრივი ან რიგითი მასშტაბებით. შემდეგ პრობლემა წარმოიქმნება გამომავალი მონაცემების დაჯგუფების რიგ დაკვირვებებში, რომლებიც შეესაბამება დაახლოებით იგივე რიცხობრივ მნიშვნელობებს. თუ ჯგუფების რაოდენობა ზედმეტად დიდია, მაშინ მათში დაკვირვებების რაოდენობა შეიძლება არასაკმარისი იყოს სანდო შედეგების მისაღებად. თუ რიცხვს ძალიან მცირე იღებთ, ამან შეიძლება გამოიწვიოს სისტემაზე გავლენის მნიშვნელოვანი მახასიათებლების დაკარგვა. მონაცემთა დაჯგუფების კონკრეტული გზა დამოკიდებულია მნიშვნელობების ცვალებადობის რაოდენობასა და ბუნებაზე. უნივარიანტულ ანალიზში ინტერვალების რაოდენობა და ზომა ყველაზე ხშირად განისაზღვრება თანაბარი ინტერვალების პრინციპით ან თანაბარი სიხშირეების პრინციპით.

დისპერსიული პრობლემების ანალიზი

ასე რომ, არის შემთხვევები, როდესაც საჭიროა ორი ან მეტი ნიმუშის შედარება. სწორედ მაშინ არის მიზანშეწონილი დისპერსიის ანალიზის გამოყენება. მეთოდის სახელწოდება მიუთითებს, რომ დასკვნები კეთდება დისპერსიული კომპონენტების შესწავლის საფუძველზე. კვლევის არსი იმაში მდგომარეობს, რომ ინდიკატორის საერთო ცვლილება დაყოფილია კომპონენტებად, რომლებიც შეესაბამება თითოეული ინდივიდუალური ფაქტორის მოქმედებას. განვიხილოთ რიგი პრობლემები, რომლებიც წყდება ტიპიური დისპერსიული ანალიზით.

მაგალითი 1

სახელოსნოში არის რამდენიმე ავტომატური მანქანა, რომელიც აწარმოებს კონკრეტულ ნაწილს. თითოეული ნაწილის ზომა არის შემთხვევითი ცვლადი, რომელიც დამოკიდებულია თითოეული მანქანის კონფიგურაციაზე და შემთხვევით გადახრებზე, რომლებიც ხდება ნაწილების წარმოების პროცესში. აუცილებელია დადგინდეს, ნაწილების ზომების გაზომვის მონაცემების საფუძველზე, არის თუ არა მანქანები კონფიგურირებული იმავე გზით.

მაგალითი 2

ელექტრომოწყობილობის დამზადებისას გამოიყენება სხვადასხვა სახის საიზოლაციო ქაღალდი: კონდენსატორი, ელექტრო და ა.შ. მოწყობილობის გაჟღენთვა შესაძლებელია სხვადასხვა ნივთიერებით: ეპოქსიდური ფისით, ლაქით, ML-2 ფისით და ა.შ. გაჟონვის აღმოფხვრა შესაძლებელია ვაკუუმში. მაღალი წნევა, გათბობით. გაჟღენთვა შეიძლება განხორციელდეს ლაქში ჩაძირვით, ლაქის უწყვეტი ნაკადის ქვეშ და ა.შ. ელექტრო აპარატი მთლიანობაში ივსება გარკვეული ნაერთით, რომლის რამდენიმე ვარიანტი არსებობს. ხარისხის ინდიკატორები არის იზოლაციის ელექტრული სიძლიერე, გრაგნილის გადახურების ტემპერატურა სამუშაო რეჟიმში და მრავალი სხვა. მოწყობილობების წარმოების ტექნოლოგიური პროცესის განვითარებისას აუცილებელია განისაზღვროს, თუ როგორ მოქმედებს თითოეული ჩამოთვლილი ფაქტორი მოწყობილობის მუშაობაზე.

მაგალითი 3

ტროლეიბუსის დეპო ემსახურება ტროლეიბუსის რამდენიმე მარშრუტს. ისინი მართავენ სხვადასხვა ტიპის ტროლეიბუსებს, მგზავრობის საფასურს კი 125 ინსპექტორი აგროვებს. დეპოს მენეჯმენტს აინტერესებს კითხვა: როგორ შევადაროთ თითოეული კონტროლერის (შემოსავლის) მუშაობის ეკონომიკური მაჩვენებლები სხვადასხვა მარშრუტებისა და სხვადასხვა ტიპის ტროლეიბუსების გათვალისწინებით? როგორ განვსაზღვროთ კონკრეტულ მარშრუტზე გარკვეული ტიპის ტროლეიბუსების წარმოების ეკონომიკური მიზანშეწონილობა? როგორ დავადგინოთ გონივრული მოთხოვნები შემოსავლის ოდენობაზე, რომელსაც კონდუქტორი მოაქვს თითოეულ მარშრუტზე სხვადასხვა ტიპის ტროლეიბუსებში?

მეთოდის არჩევის ამოცანაა, თუ როგორ მივიღოთ მაქსიმალური ინფორმაცია თითოეული ფაქტორის გავლენის შესახებ საბოლოო შედეგზე, განვსაზღვროთ ასეთი გავლენის რიცხვითი მახასიათებლები, მათი საიმედოობა მინიმალურ ფასად და უმოკლეს დროში. დისპერსიული ანალიზის მეთოდები ასეთი პრობლემების გადაჭრის საშუალებას იძლევა.

უნივარიანტული ანალიზი

კვლევის მიზანია შეაფასოს კონკრეტული შემთხვევის გავლენის სიდიდე გაანალიზებულ მიმოხილვაზე. უნივარიატიული ანალიზის კიდევ ერთი მიზანი შეიძლება იყოს ორი ან მეტი გარემოების ერთმანეთთან შედარება, რათა დადგინდეს მათი გავლენის განსხვავება გახსენებაზე. თუ ნულოვანი ჰიპოთეზა უარყოფილია, მაშინ შემდეგი ნაბიჯი არის მიღებული მახასიათებლებისთვის ნდობის ინტერვალების რაოდენობრივი დადგენა და აგება. იმ შემთხვევაში, როდესაც ნულოვანი ჰიპოთეზის უარყოფა შეუძლებელია, ის ჩვეულებრივ მიიღება და კეთდება დასკვნა გავლენის ხასიათის შესახებ.

დისპერსიის ცალმხრივი ანალიზი შეიძლება გახდეს კრუსკალ-ვალისის რანგის მეთოდის არაპარამეტრული ანალოგი. იგი შეიმუშავეს ამერიკელმა მათემატიკოსმა უილიამ კრუსკალმა და ეკონომისტმა უილსონ უოლისმა 1952 წელს. ეს კრიტერიუმი შექმნილია შესწავლილ ნიმუშებზე ეფექტების თანასწორობის ნულოვანი ჰიპოთეზის შესამოწმებლად უცნობი, მაგრამ თანაბარი საშუალო მნიშვნელობებით. ამ შემთხვევაში ნიმუშების რაოდენობა ორზე მეტი უნდა იყოს.

Jonckheere-Terpstra კრიტერიუმი დამოუკიდებლად შემოგვთავაზა ჰოლანდიელმა მათემატიკოსმა T. J. Terpstra-მ 1952 წელს და ბრიტანელი ფსიქოლოგმა E.R. Jonckheere-მ 1954 წელს. იგი გამოიყენება მაშინ, როდესაც წინასწარ არის ცნობილი, რომ შედეგების არსებული ჯგუფები დალაგებულია შედეგების გავლენის ზრდის მიხედვით. შესასწავლი ფაქტორი, რომელიც იზომება რიგითი სკალით.

M - ბარტლეტის ტესტი, რომელიც შემოთავაზებულია ბრიტანელი სტატისტიკოსის მორის სტივენსონ ბარტლეტის მიერ 1937 წელს, გამოიყენება ნულოვანი ჰიპოთეზის შესამოწმებლად რამდენიმე ნორმალური პოპულაციის დისპერსიების თანასწორობის შესახებ, საიდანაც აღებულია შესასწავლი ნიმუშები, ზოგადად განსხვავებული ზომის (თითოეულის რაოდენობა). ნიმუში უნდა იყოს მინიმუმ ოთხი).

G - კოქრანის ტესტი, რომელიც აღმოაჩინა ამერიკელმა უილიამ გემელ კოკრანმა 1941 წელს. იგი გამოიყენება ნულოვანი ჰიპოთეზის შესამოწმებლად ნორმალური პოპულაციების დისპერსიების თანასწორობის შესახებ თანაბარი ზომის დამოუკიდებელ ნიმუშებში.

არაპარამეტრული ლევენის ტესტი, რომელიც შემოთავაზებულია ამერიკელი მათემატიკოსის ჰოვარდ ლევენის მიერ 1960 წელს, არის ბარტლეტის ტესტის ალტერნატივა იმ პირობებში, როდესაც არ არის დარწმუნებული, რომ შესასწავლი ნიმუშები ექვემდებარება ნორმალურ განაწილებას.

1974 წელს ამერიკელმა სტატისტიკოსებმა Morton B. Brown-მა და Alan B. Forsythe-მა შემოგვთავაზეს ტესტი (Brown-Forsyth test), რომელიც ოდნავ განსხვავდება ლევენის ტესტისგან.

ორფაქტორიანი ანალიზი

დისპერსიის ორმხრივი ანალიზი გამოიყენება ნორმალურად განაწილებული ნიმუშებისთვის. პრაქტიკაში, ამ მეთოდის კომპლექსური ცხრილები ხშირად გამოიყენება, კერძოდ ის, რომლებშიც თითოეული უჯრედი შეიცავს მონაცემთა ერთობლიობას (განმეორებითი გაზომვები), რომლებიც შეესაბამება ფიქსირებული დონის მნიშვნელობებს. თუ დისპერსიის ორმხრივი ანალიზის გამოსაყენებლად საჭირო დაშვებები არ არის დაკმაყოფილებული, გამოიყენეთ არაპარამეტრული ფრიდმანის რანგის ტესტი (ფრიდმანი, კენდალი და სმიტი), რომელიც შემუშავებულია ამერიკელი ეკონომისტის მილტონ ფრიდმანის მიერ 1930 წლის ბოლოს. ეს ტესტი არ არის დამოკიდებული ტიპზე. განაწილების.

მხოლოდ ვარაუდობენ, რომ მნიშვნელობების განაწილება იდენტური და უწყვეტია და რომ ისინი თავად არიან ერთმანეთისგან დამოუკიდებელი. ნულოვანი ჰიპოთეზის ტესტირებისას გამომავალი მონაცემები წარმოდგენილია მართკუთხა მატრიცის სახით, რომელშიც სტრიქონები შეესაბამება B ფაქტორის დონეებს, ხოლო სვეტები A-ს დონეებს. ცხრილის (ბლოკის) თითოეული უჯრედი შეიძლება იყოს. პარამეტრების გაზომვის შედეგი ერთ ობიექტზე ან ობიექტთა ჯგუფზე ორივე ფაქტორის დონის მუდმივი მნიშვნელობებით. ამ შემთხვევაში, შესაბამისი მონაცემები წარმოდგენილია, როგორც გარკვეული პარამეტრის საშუალო მნიშვნელობები შესწავლილი ნიმუშის ყველა განზომილებისთვის ან ობიექტისთვის. გამომავალი კრიტერიუმის გამოსაყენებლად აუცილებელია გაზომვების პირდაპირი შედეგებიდან მათ წოდებაზე გადასვლა. რეიტინგი ხორციელდება თითოეული რიგისთვის ცალკე, ანუ მნიშვნელობები შეკვეთილია თითოეული ფიქსირებული მნიშვნელობისთვის.

პეიჯის ტესტი (L-test), შემოთავაზებული ამერიკელმა სტატისტიკოსმა E. B. Page-მა 1963 წელს, შექმნილია ნულოვანი ჰიპოთეზის შესამოწმებლად. დიდი ნიმუშებისთვის გამოიყენება გვერდის მიახლოება. ისინი, შესაბამისი ნულოვანი ჰიპოთეზების რეალობის გათვალისწინებით, ემორჩილებიან სტანდარტულ ნორმალურ განაწილებას. იმ შემთხვევაში, როდესაც წყაროს ცხრილის სტრიქონებს აქვთ იგივე მნიშვნელობები, აუცილებელია საშუალო რანგის გამოყენება. ამ შემთხვევაში, დასკვნების სიზუსტე უფრო უარესი იქნება, რაც უფრო მეტი იქნება ასეთი მატჩების რაოდენობა.

Q - Cochran-ის კრიტერიუმი, შემოთავაზებული W. Cochran-ის მიერ 1937 წელს. იგი გამოიყენება იმ შემთხვევებში, როდესაც ერთგვაროვანი სუბიექტების ჯგუფები ექვემდებარებიან გავლენებს, რომელთა რაოდენობა აღემატება ორს და რომელთათვისაც შესაძლებელია უკუკავშირის ორი ვარიანტი - პირობითად უარყოფითი (0) და პირობითად დადებითი (1) . ნულოვანი ჰიპოთეზა შედგება მკურნალობის ეფექტის თანაბარისაგან. დისპერსიის ორმხრივი ანალიზი შესაძლებელს ხდის მკურნალობის ეფექტების არსებობის დადგენას, მაგრამ არ იძლევა იმის დადგენას, თუ რომელი კონკრეტული სვეტებისთვის არსებობს ეს ეფექტი. ამ პრობლემის გადასაჭრელად გამოყენებულია სქეფის მრავალჯერადი განტოლების მეთოდი დაკავშირებული ნიმუშებისთვის.

მრავალვარიანტული ანალიზი

დისპერსიის მრავალვარიანტული ანალიზის პრობლემა ჩნდება მაშინ, როდესაც თქვენ უნდა დაადგინოთ ორი ან მეტი პირობის ეფექტი გარკვეულ შემთხვევით ცვლადზე. კვლევა გულისხმობს ერთი დამოკიდებული შემთხვევითი ცვლადის არსებობას, რომელიც იზომება სხვაობის ან თანაფარდობის შკალაზე, და რამდენიმე დამოუკიდებელი ცვლადის არსებობას, რომელთაგან თითოეული გამოიხატება დასახელების ან რანგის სკალაზე. მონაცემთა ვარიაციული ანალიზი არის მათემატიკური სტატისტიკის საკმაოდ განვითარებული განყოფილება, რომელსაც აქვს უამრავი ვარიანტი. კვლევის კონცეფცია საერთოა როგორც ერთფაქტორიანი, ასევე მულტიფაქტორისთვის. მისი არსი მდგომარეობს იმაში, რომ მთლიანი განსხვავება იყოფა კომპონენტებად, რაც შეესაბამება მონაცემების გარკვეულ დაჯგუფებას. თითოეულ მონაცემთა დაჯგუფებას აქვს საკუთარი მოდელი. აქ განვიხილავთ მხოლოდ ძირითად დებულებებს, რომლებიც აუცილებელია მისი ყველაზე ხშირად გამოყენებული ვარიანტების გასაგებად და პრაქტიკული გამოყენებისთვის.

ფაქტორების დისპერსიული ანალიზი მოითხოვს საკმაოდ ფრთხილ დამოკიდებულებას შეტანილი მონაცემების შეგროვებისა და წარმოდგენისადმი და განსაკუთრებით შედეგების ინტერპრეტაციის მიმართ. ერთი ფაქტორიანი ტესტისგან განსხვავებით, რომლის შედეგები შეიძლება პირობითად განთავსდეს გარკვეული თანმიმდევრობით, ორფაქტორიანი ტესტის შედეგები მოითხოვს უფრო რთულ პრეზენტაციას. სიტუაცია კიდევ უფრო რთულდება, როდესაც არსებობს სამი, ოთხი ან მეტი გარემოება. ამის გამო საკმაოდ იშვიათია მოდელში სამ (ოთხ)ზე მეტი პირობის ჩართვა. მაგალითი იქნება რეზონანსის წარმოქმნა ელექტრული წრის ტევადობისა და ინდუქციურობის გარკვეულ მნიშვნელობაზე; ქიმიური რეაქციის გამოვლინება ელემენტების გარკვეულ კომპლექტთან, საიდანაც აგებულია სისტემა; კომპლექსურ სისტემებში ანომალიური ეფექტების გაჩენა გარემოებების გარკვეულ დამთხვევაში. ურთიერთქმედების არსებობამ შეიძლება რადიკალურად შეცვალოს სისტემის მოდელი და ზოგჯერ გამოიწვიოს იმ ფენომენების ბუნების გადახედვა, რომლებთანაც საქმე ექსპერიმენტატორია.

დისპერსიის მრავალვარიანტული ანალიზი განმეორებითი ექსპერიმენტებით

გაზომვის მონაცემები საკმაოდ ხშირად შეიძლება დაჯგუფდეს არა ორი, არამედ ფაქტორების უფრო დიდი რაოდენობით. ამრიგად, თუ გავითვალისწინებთ ტროლეიბუსის ბორბლების საბურავების მომსახურების ვადის დისპერსიულ ანალიზს გარემოებების გათვალისწინებით (საწარმოო ქარხანა და მარშრუტი, რომელზედაც მუშაობს საბურავები), მაშინ ცალკე პირობად შეგვიძლია გამოვყოთ სეზონი, რომლის დროსაც საბურავები მუშაობს (კერძოდ: ზამთრის და ზაფხულის ექსპლუატაცია). შედეგად გვექნება სამფაქტორიანი მეთოდის პრობლემა.

თუ მეტი პირობაა, მიდგომა იგივეა, რაც ორფაქტორიან ანალიზში. ყველა შემთხვევაში ცდილობენ მოდელის გამარტივებას. ორი ფაქტორის ურთიერთქმედების ფენომენი არც ისე ხშირად ჩნდება და სამმაგი ურთიერთქმედება მხოლოდ გამონაკლის შემთხვევებში ხდება. ჩართეთ ის ურთიერთქმედებები, რომლებზეც არსებობს წინა ინფორმაცია და კარგი მიზეზები მოდელში გასათვალისწინებლად. ინდივიდუალური ფაქტორების იდენტიფიცირებისა და მათი გათვალისწინების პროცესი შედარებით მარტივია. ამიტომ, ხშირად ჩნდება მეტი გარემოებების გამოკვეთის სურვილი. თქვენ არ უნდა გაიტაცოთ ამით. რაც უფრო მეტი პირობაა, მით უფრო ნაკლებად სანდო ხდება მოდელი და უფრო დიდია შეცდომის ალბათობა. თავად მოდელი, რომელიც მოიცავს დამოუკიდებელ ცვლადების დიდ რაოდენობას, ხდება საკმაოდ რთული ინტერპრეტაციისთვის და პრაქტიკული გამოყენებისთვის მოუხერხებელი.

დისპერსიის ანალიზის ზოგადი იდეა

სტატისტიკის დისპერსიის ანალიზი არის დაკვირვების შედეგების მიღების მეთოდი, რომელიც დამოკიდებულია ერთდროულად მოქმედ გარემოებებზე და მათი გავლენის შეფასება. კონტროლირებად ცვლადს, რომელიც შეესაბამება კვლევის ობიექტზე ზემოქმედების მეთოდს და გარკვეული პერიოდის განმავლობაში გარკვეულ მნიშვნელობას იძენს, ფაქტორი ეწოდება. ისინი შეიძლება იყოს ხარისხობრივი და რაოდენობრივი. რაოდენობრივი პირობების დონეები გარკვეულ მნიშვნელობას იძენს რიცხვითი მასშტაბით. მაგალითებია ტემპერატურა, წნევის წნევა, ნივთიერების რაოდენობა. ხარისხობრივი ფაქტორებია სხვადასხვა ნივთიერებები, სხვადასხვა ტექნოლოგიური მეთოდები, მოწყობილობები, შემავსებლები. მათი დონეები შეესაბამება სახელების მასშტაბს.

ხარისხი ასევე შეიძლება შეიცავდეს შესაფუთი მასალის ტიპს და დოზირების ფორმის შენახვის პირობებს. ასევე რაციონალურია ნედლეულის დაფქვის ხარისხის, გრანულების ფრაქციული შემადგენლობის ჩართვა, რომლებსაც რაოდენობრივი მნიშვნელობა აქვთ, მაგრამ რაოდენობრივი შკალის გამოყენების შემთხვევაში ძნელი დასარეგულირებელია. ხარისხობრივი ფაქტორების რაოდენობა დამოკიდებულია დოზირების ფორმის ტიპზე, აგრეთვე სამკურნალო ნივთიერებების ფიზიკურ და ტექნოლოგიურ თვისებებზე. მაგალითად, ტაბლეტების მიღება შესაძლებელია კრისტალური ნივთიერებებისგან პირდაპირი შეკუმშვით. ამ შემთხვევაში საკმარისია მოცურების და საპოხი ნივთიერებების შერჩევა.

ხარისხის ფაქტორების მაგალითები სხვადასხვა ტიპის დოზირების ფორმებისთვის

  • ნაყენები.ექსტრაქტორის შემადგენლობა, ექსტრაქტორის ტიპი, ნედლეულის მომზადების მეთოდი, წარმოების მეთოდი, ფილტრაციის მეთოდი.
  • ექსტრაქტები (თხევადი, სქელი, მშრალი).ექსტრაქტორის შემადგენლობა, ექსტრაქციის მეთოდი, ინსტალაციის ტიპი, ექსტრაქტორი და ბალასტური ნივთიერებების მოცილების მეთოდი.
  • აბები.დამხმარე ნივთიერებების, შემავსებლების, დეზინტეგრატორების, შემკვრელების, ლუბრიკანტების და საპოხი მასალების შემადგენლობა. ტაბლეტების მიღების მეთოდი, ტექნოლოგიური აღჭურვილობის ტიპი. გარსის ტიპი და მისი კომპონენტები, ფირის შემქმნელი, პიგმენტები, საღებავები, პლასტიზატორები, გამხსნელები.
  • საინექციო ხსნარები.გამხსნელის ტიპი, ფილტრაციის მეთოდი, სტაბილიზატორებისა და კონსერვანტების ბუნება, სტერილიზაციის პირობები, ამპულების შევსების მეთოდი.
  • სუპოზიტორები.სუპოზიტორების ფუძის შემადგენლობა, სუპოზიტორების წარმოების მეთოდი, შემავსებლები, შეფუთვა.
  • მალამოები.ფუძის შემადგენლობა, სტრუქტურული კომპონენტები, მალამოს მომზადების მეთოდი, აღჭურვილობის ტიპი, შეფუთვა.
  • კაფსულები.გარსის მასალის ტიპი, კაფსულების დამზადების მეთოდი, პლასტიზატორის ტიპი, კონსერვანტი, საღებავი.
  • ლინიმენტები.მომზადების მეთოდი, შემადგენლობა, აღჭურვილობის ტიპი, ემულგატორის ტიპი.
  • შეჩერებები.გამხსნელის ტიპი, სტაბილიზატორის ტიპი, დისპერსიის მეთოდი.

ტაბლეტების წარმოების პროცესში შესწავლილი ხარისხის ფაქტორების მაგალითები და მათი დონეები

  • Ფქვილი.კარტოფილის სახამებელი, თეთრი თიხა, ნატრიუმის ბიკარბონატის ნაზავი ლიმონმჟავასთან, ძირითადი მაგნიუმის კარბონატი.
  • დამაკავშირებელი ხსნარი.წყალი, სახამებლის პასტა, შაქრის სიროფი, მეთილცელულოზის ხსნარი, ჰიდროქსიპროპილმეთილცელულოზის ხსნარი, პოლივინილპიროლიდონის ხსნარი, პოლივინილ სპირტის ხსნარი.
  • მოცურების ნივთიერება.აეროსილი, სახამებელი, ტალკი.
  • შემავსებელი.შაქარი, გლუკოზა, ლაქტოზა, ნატრიუმის ქლორიდი, კალციუმის ფოსფატი.
  • ლუბრიკანტი.სტეარინის მჟავა, პოლიეთილენ გლიკოლი, პარაფინი.

დისპერსიული ანალიზის მოდელები სახელმწიფო კონკურენტუნარიანობის დონის შესწავლაში

სახელმწიფოს მდგომარეობის შეფასების ერთ-ერთი ყველაზე მნიშვნელოვანი კრიტერიუმი, რომლითაც ფასდება მისი კეთილდღეობისა და სოციალურ-ეკონომიკური განვითარების დონე, არის კონკურენტუნარიანობა, ანუ ეროვნული ეკონომიკისთვის დამახასიათებელი თვისებების ერთობლიობა, რომელიც განსაზღვრავს სახელმწიფოს. სხვა ქვეყნებთან კონკურენციის უნარი. მსოფლიო ბაზარზე სახელმწიფოს ადგილისა და როლის განსაზღვრის შემდეგ, შესაძლებელია საერთაშორისო მასშტაბით ეკონომიკური უსაფრთხოების უზრუნველსაყოფად მკაფიო სტრატეგიის ჩამოყალიბება, რადგან ეს არის პოზიტიური ურთიერთობების გასაღები რუსეთსა და მსოფლიო ბაზარზე ყველა მოთამაშეს შორის: ინვესტორებს შორის. კრედიტორები და მთავრობები.

სახელმწიფოთა კონკურენტუნარიანობის დონის შესადარებლად, ქვეყნების რეიტინგები ხდება რთული ინდექსების გამოყენებით, რომლებიც მოიცავს სხვადასხვა შეწონილ მაჩვენებლებს. ეს ინდექსები ემყარება ეკონომიკურ, პოლიტიკურ და ა.შ ვითარებაზე გავლენის ძირითად ფაქტორებს. სახელმწიფო კონკურენტუნარიანობის შესწავლის მოდელების ნაკრები მოიცავს მრავალვარიანტული სტატისტიკური ანალიზის მეთოდების გამოყენებას (კერძოდ, დისპერსიის ანალიზი (სტატისტიკა), ეკონომეტრიული მოდელირება, გადაწყვეტილების მიღება) და მოიცავს შემდეგ ძირითად ეტაპებს:

  1. ინდიკატორების სისტემის ფორმირება.
  2. სახელმწიფო კონკურენტუნარიანობის მაჩვენებლების შეფასება და პროგნოზირება.
  3. სახელმწიფოთა კონკურენტუნარიანობის მაჩვენებლების შედარება.

ახლა მოდით შევხედოთ ამ კომპლექსის თითოეული ეტაპის მოდელების შინაარსს.

პირველ ეტაპზესაექსპერტო კვლევის მეთოდების გამოყენებით ყალიბდება სახელმწიფოს კონკურენტუნარიანობის შესაფასებლად ეკონომიკური ინდიკატორების დასაბუთებული ნაკრები, მისი განვითარების სპეციფიკის გათვალისწინებით, საერთაშორისო რეიტინგებზე და სტატისტიკური დეპარტამენტების მონაცემებზე დაყრდნობით, რომელიც ასახავს სისტემის მთლიან მდგომარეობას. და მისი პროცესები. ამ ინდიკატორების არჩევანი გამართლებულია იმ ინდიკატორების შერჩევის აუცილებლობით, რომლებიც ყველაზე სრულად, პრაქტიკული თვალსაზრისით, საშუალებას გვაძლევს განვსაზღვროთ სახელმწიფოს დონე, მისი საინვესტიციო მიმზიდველობა და არსებული პოტენციური და ფაქტობრივი საფრთხეების შედარებითი ლოკალიზაციის შესაძლებლობა.

საერთაშორისო სარეიტინგო სისტემების ძირითადი მაჩვენებლებია:

  1. გლობალური კონკურენტუნარიანობა (GC).
  2. ეკონომიკური თავისუფლება (IES).
  3. ადამიანური განვითარება (HDI).
  4. კორუფციის აღქმა (CPC).
  5. შიდა და გარე საფრთხეები (IETH).
  6. საერთაშორისო გავლენის პოტენციალი (IPIP).

მეორე ფაზაითვალისწინებს სახელმწიფო კონკურენტუნარიანობის მაჩვენებლების შეფასებას და პროგნოზირებას საერთაშორისო რეიტინგების მიხედვით შესწავლილი მსოფლიოს 139 ქვეყნისთვის.

მესამე ეტაპიითვალისწინებს სახელმწიფოთა კონკურენტუნარიანობის პირობების შედარებას კორელაციური და რეგრესიული ანალიზის მეთოდების გამოყენებით.

კვლევის შედეგების გამოყენებით შესაძლებელია განისაზღვროს პროცესების ხასიათი ზოგადად და სახელმწიფოს კონკურენტუნარიანობის ცალკეული კომპონენტები; შეამოწმეთ ჰიპოთეზა ფაქტორების გავლენისა და მათი ურთიერთობის შესახებ მნიშვნელობის შესაბამის დონეზე.

შემოთავაზებული მოდელების დანერგვა საშუალებას მისცემს არა მხოლოდ შეაფასოს სახელმწიფოების კონკურენტუნარიანობის და საინვესტიციო მიმზიდველობის დონის არსებული მდგომარეობა, არამედ გააანალიზოს მენეჯმენტის ხარვეზები, თავიდან აიცილოს არასწორი გადაწყვეტილებების შეცდომები და თავიდან აიცილოს კრიზისის განვითარება ქვეყანაში. სახელმწიფო.

დისპერსიის ანალიზი

1. ვარიაციის ანალიზის კონცეფცია

დისპერსიის ანალიზიარის რაიმე კონტროლირებადი ცვლადი ფაქტორების გავლენის ქვეშ მახასიათებლის ცვალებადობის ანალიზი. უცხოურ ლიტერატურაში დისპერსიის ანალიზს ხშირად მოიხსენიებენ როგორც ANOVA, რომელიც ითარგმნება როგორც ცვალებადობის ანალიზი (Analysis of Variance).

ANOVA პრობლემაშედგება მახასიათებლის ზოგადი ცვალებადობისგან განსხვავებული სახის ცვალებადობის გამოყოფაში:

ა) ცვალებადობა შესწავლილი თითოეული დამოუკიდებელი ცვლადის მოქმედებით;

ბ) ცვალებადობა შესწავლილი დამოუკიდებელი ცვლადების ურთიერთქმედების გამო;

გ) შემთხვევითი ცვალებადობა ყველა სხვა უცნობი ცვლადის გამო.

შესწავლილი ცვლადების მოქმედებით და მათი ურთიერთქმედებით გამოწვეული ცვალებადობა კორელაციაშია შემთხვევით ცვალებადობასთან. ამ ურთიერთობის მაჩვენებელია ფიშერის F ტესტი.

F კრიტერიუმის გამოთვლის ფორმულა მოიცავს დისპერსიების შეფასებას, ანუ ატრიბუტის განაწილების პარამეტრებს, შესაბამისად F კრიტერიუმი პარამეტრული კრიტერიუმია.

რაც უფრო მეტად არის თვისების ცვალებადობა განპირობებული შესწავლილი ცვლადებით (ფაქტორებით) ან მათი ურთიერთქმედებით, მით უფრო მაღალია ემპირიული კრიტერიუმის მნიშვნელობები.

Ნული დისპერსიის ანალიზის ჰიპოთეზაში ნათქვამია, რომ შესწავლილი ეფექტური მახასიათებლის საშუალო მნიშვნელობები ყველა გრადაციაში ერთნაირია.

ალტერნატივა ჰიპოთეზაში ნათქვამია, რომ მიღებული მახასიათებლის საშუალო მნიშვნელობები შესწავლილი ფაქტორის სხვადასხვა გრადაციაში განსხვავებულია.

დისპერსიის ანალიზი საშუალებას გვაძლევს განვაცხადოთ ცვლილება მახასიათებლებში, მაგრამ არ მიუთითებს მიმართულებაეს ცვლილებები.

დისპერსიული ანალიზის განხილვა დავიწყოთ უმარტივესი შემთხვევით, როდესაც ვსწავლობთ მხოლოდ მოქმედებას ერთიცვლადი (ერთი ფაქტორი).

2. დისპერსიის ცალმხრივი ანალიზი დაუკავშირებელი ნიმუშებისთვის

2.1. მეთოდის მიზანი

დისპერსიის ერთფაქტორიანი ანალიზის მეთოდი გამოიყენება იმ შემთხვევებში, როდესაც ეფექტური მახასიათებლის ცვლილებები შესწავლილია ცვალებადი პირობების ან ფაქტორის გრადაციის გავლენის ქვეშ. მეთოდის ამ ვერსიაში ფაქტორების თითოეული გრადაციის გავლენა არის განსხვავებულისაგნების ნიმუშები. ფაქტორის მინიმუმ სამი გრადაცია უნდა იყოს. (შეიძლება იყოს ორი გრადაცია, მაგრამ ამ შემთხვევაში ჩვენ ვერ დავადგინეთ არაწრფივი დამოკიდებულებები და უფრო გონივრული ჩანს უფრო მარტივის გამოყენება).

ამ ტიპის ანალიზის არაპარამეტრული ვერსიაა Kruskal-Wallis H ტესტი.

ჰიპოთეზები

H 0: განსხვავება ფაქტორების კლასებს შორის (განსხვავებული პირობები) არ აღემატება შემთხვევით განსხვავებებს თითოეულ ჯგუფში.

H 1: განსხვავებები ფაქტორების კლასებს შორის (სხვადასხვა პირობები) უფრო მეტია, ვიდრე შემთხვევითი განსხვავებები თითოეულ ჯგუფში.

2.2. ვარიაციის ცალმხრივი ანალიზის შეზღუდვები დაუკავშირებელი ნიმუშებისთვის

1. დისპერსიის ცალმხრივი ანალიზი მოითხოვს ფაქტორის მინიმუმ სამ გრადაციას და მინიმუმ ორ საგანს თითოეულ გრადაციაში.

2. მიღებული მახასიათებელი ნორმალურად უნდა იყოს განაწილებული შესასწავლ ნიმუშში.

მართალია, ჩვეულებრივ არ არის მითითებული, ვსაუბრობთ მახასიათებლის განაწილებაზე მთელ გამოკითხულ ნიმუშში თუ მის იმ ნაწილში, რომელიც ქმნის დისპერსიულ კომპლექსს.

3. პრობლემის გადაჭრის მაგალითი ცალმხრივი დისპერსიის ანალიზის მეთოდით დაუკავშირებელი ნიმუშებისთვის მაგალითის გამოყენებით:

ექვსი საგნისგან შემდგარ სამ სხვადასხვა ჯგუფს გადაეცა ათი სიტყვის სია. პირველ ჯგუფს სიტყვები წარუდგინეს დაბალი სიჩქარით - 1 სიტყვა 5 წამში, მეორე ჯგუფს საშუალო სიჩქარით - 1 სიტყვა 2 წამში, ხოლო მესამე ჯგუფს დიდი სიჩქარით - 1 სიტყვა წამში. რეპროდუცირების შესრულება ნაწინასწარმეტყველები იყო, რომ დამოკიდებული იქნებოდა სიტყვების პრეზენტაციის სიჩქარეზე. შედეგები წარმოდგენილია ცხრილში. 1.

რეპროდუცირებული სიტყვების რაოდენობა ცხრილი 1

თემა No.

დაბალი სიჩქარე

საშუალო სიჩქარე

მაღალი სიჩქარე

მთლიანი რაოდენობა

H 0: განსხვავებები სიტყვის წარმოების ხანგრძლივობით შორისჯგუფები არ არის უფრო გამოხატული, ვიდრე შემთხვევითი განსხვავებები შიგნითთითოეული ჯგუფი.

H1: განსხვავებები სიტყვების წარმოების მოცულობაში შორისჯგუფები უფრო გამოხატულია, ვიდრე შემთხვევითი განსხვავებები შიგნითთითოეული ჯგუფი. ცხრილში წარმოდგენილი ექსპერიმენტული მნიშვნელობების გამოყენებით. 1, ჩვენ დავამყარებთ რამდენიმე მნიშვნელობას, რომელიც საჭირო იქნება F კრიტერიუმის გამოსათვლელად.

ცალმხრივი დისპერსიული ანალიზისთვის ძირითადი რაოდენობების გამოთვლა მოცემულია ცხრილში:

მაგიდა 2

ცხრილი 3

ოპერაციების თანმიმდევრობა ცალმხრივი დისპერსიის ანალიზში დაუკავშირებელი ნიმუშებისთვის

ხშირად გვხვდება ამ და შემდეგ ცხრილებში, აღნიშვნა SS არის აბრევიატურა "კვადრატების ჯამი". ეს აბრევიატურა ყველაზე ხშირად გამოიყენება თარგმნილ წყაროებში.

SS ფაქტინიშნავს მახასიათებლის ცვალებადობას შესწავლილი ფაქტორის მოქმედებით;

SS ზოგადად- ნიშან-თვისების ზოგადი ცვალებადობა;

C.A.-ცვალებადობა გამოუანგარიშებელი ფაქტორების გამო, „შემთხვევითი“ ან „ნარჩენი“ ცვალებადობა.

ᲥᲐᲚᲑᲐᲢᲝᲜᲘ- „საშუალო კვადრატი“, ან კვადრატების ჯამის მათემატიკური მოლოდინი, შესაბამისი SS-ის საშუალო მნიშვნელობა.

დფ - თავისუფლების ხარისხების რაოდენობა, რომელიც არაპარამეტრული კრიტერიუმების განხილვისას აღვნიშნეთ ბერძნული ასოთი .

დასკვნა: H 0 უარყოფილია. H 1 მიღებულია. ჯგუფებს შორის სიტყვების გახსენებაში განსხვავებები უფრო დიდი იყო, ვიდრე შემთხვევითი განსხვავებები თითოეულ ჯგუფში (α=0.05). ასე რომ, სიტყვების წარმოდგენის სიჩქარე გავლენას ახდენს მათი რეპროდუქციის მოცულობაზე.

Excel-ში პრობლემის გადაჭრის მაგალითი მოცემულია ქვემოთ:

საწყისი მონაცემები:

ბრძანების გამოყენებით: Tools->Data Analysis->One-way ANOVA ვიღებთ შემდეგ შედეგებს:

ზემოთ განხილული ტექნიკა ორ საშუალებას შორის განსხვავებების მნიშვნელობის შესახებ სტატისტიკური ჰიპოთეზების შესამოწმებლად, პრაქტიკაში შეზღუდულია. ეს გამოწვეულია იმით, რომ ყველა შესაძლო პირობისა და ფაქტორის ეფექტურ მახასიათებელზე ზემოქმედების იდენტიფიცირების მიზნით, საველე და ლაბორატორიული ექსპერიმენტები, როგორც წესი, ტარდება არა ორი, არამედ უფრო დიდი რაოდენობის ნიმუშების გამოყენებით (1220 ან მეტი). ).

ხშირად მკვლევარები ადარებენ რამდენიმე ნიმუშის საშუალებებს, რომლებიც გაერთიანებულია ერთ კომპლექსში. მაგალითად, მოსავლის მოსავლიანობაზე სასუქების სხვადასხვა ტიპისა და დოზების გავლენის შესწავლისას, ექსპერიმენტები მეორდება სხვადასხვა ვერსიით. ამ შემთხვევებში, წყვილთა შედარება რთული ხდება და მთელი კომპლექსის სტატისტიკური ანალიზი მოითხოვს სპეციალური მეთოდის გამოყენებას. მათემატიკურ სტატისტიკაში შემუშავებულ ამ მეთოდს დისპერსიის ანალიზს უწოდებენ. იგი პირველად გამოიყენა ინგლისელმა სტატისტიკოსმა რ. ფიშერმა აგრონომიული ექსპერიმენტების შედეგების დამუშავებისას (1938 წ.).

დისპერსიის ანალიზიარის ეფექტური მახასიათებლის ერთ ან რამდენიმე ფაქტორზე დამოკიდებულების გამოვლენის სანდოობის სტატისტიკური შეფასების მეთოდი. დისპერსიული ანალიზის მეთოდის გამოყენებით, სტატისტიკური ჰიპოთეზები შემოწმებულია საშუალოდ რამდენიმე ზოგად პოპულაციაში, რომლებსაც აქვთ ნორმალური განაწილება.

დისპერსიული ანალიზი ექსპერიმენტული შედეგების სტატისტიკური შეფასების ერთ-ერთი მთავარი მეთოდია. ის ასევე სულ უფრო ხშირად გამოიყენება ეკონომიკური ინფორმაციის ანალიზში. დისპერსიის ანალიზი შესაძლებელს ხდის განვსაზღვროთ, თუ რამდენად არის საკმარისი შედეგიან და ფაქტორულ მახასიათებლებს შორის ურთიერთკავშირის სანიმუშო ინდიკატორები, რათა გავრცელდეს ნიმუშიდან მიღებული მონაცემები ზოგად პოპულაციაზე. ამ მეთოდის უპირატესობა ის არის, რომ იგი იძლევა საკმაოდ საიმედო დასკვნებს მცირე ნიმუშებიდან.

ეფექტური მახასიათებლის ცვალებადობის შესწავლით ერთი ან რამდენიმე ფაქტორის გავლენის ქვეშ დისპერსიული ანალიზის გამოყენებით, შეიძლება მივიღოთ, გარდა დამოკიდებულებების მნიშვნელობის ზოგადი შეფასებისა, ასევე შეფასდეს ფორმირებული საშუალებების სიდიდის განსხვავებები. ფაქტორების სხვადასხვა დონეზე და ფაქტორების ურთიერთქმედების მნიშვნელობა. დისპერსიის ანალიზი გამოიყენება როგორც რაოდენობრივი, ისე ხარისხობრივი მახასიათებლების დამოკიდებულების, ასევე მათი კომბინაციის შესასწავლად.

ამ მეთოდის არსი არის ერთი ან რამდენიმე ფაქტორის გავლენის ალბათობის სტატისტიკური შესწავლა, აგრეთვე მათი ურთიერთქმედება მიღებულ მახასიათებელზე. ამის მიხედვით, ვარიანტული ანალიზის გამოყენებით წყდება სამი ძირითადი ამოცანა: 1) ჯგუფურ საშუალებებს შორის განსხვავებების მნიშვნელოვნების ზოგადი შეფასება; 2) ფაქტორებს შორის ურთიერთქმედების ალბათობის შეფასება; 3) საშუალების წყვილებს შორის განსხვავებების მნიშვნელოვნების შეფასება. ყველაზე ხშირად, მკვლევარებს უწევთ ამგვარი პრობლემების გადაჭრა საველე და ზოოტექნიკური ექსპერიმენტების ჩატარებისას, როდესაც შესწავლილია რამდენიმე ფაქტორის გავლენა ეფექტურ თვისებაზე.

დისპერსიული ანალიზის პრინციპული სქემა მოიცავს ეფექტური მახასიათებლის ვარიაციის ძირითადი წყაროების დადგენას და ვარიაციის მოცულობის (კვადრატული გადახრების ჯამის) განსაზღვრას მისი ფორმირების წყაროების მიხედვით; მთლიანი ვარიაციის კომპონენტების შესაბამისი თავისუფლების ხარისხების რაოდენობის განსაზღვრა; დისპერსიების გამოთვლა, როგორც ცვალებადობის შესაბამისი მოცულობების თანაფარდობა თავისუფლების ხარისხების რაოდენობასთან; დისპერსიებს შორის ურთიერთობის ანალიზი; საშუალებებს შორის სხვაობის სანდოობის შეფასება და დასკვნების გამოტანა.

ეს სქემა შენარჩუნებულია როგორც დისპერსიული ანალიზის მარტივ მოდელებში, როდესაც მონაცემები დაჯგუფებულია ერთი მახასიათებლით, ასევე რთულ მოდელებში, როდესაც მონაცემები დაჯგუფებულია ორი ან მეტი მახასიათებლით. თუმცა, ჯგუფის მახასიათებლების რაოდენობის მატებასთან ერთად, მისი ფორმირების წყაროების მიხედვით მთლიანი ვარიაციის დაშლის პროცესი უფრო რთული ხდება.

პრინციპული დიაგრამის მიხედვით, დისპერსიის ანალიზი შეიძლება წარმოდგენილი იყოს ხუთი თანმიმდევრული ეტაპის სახით:

1) ვარიაციის განსაზღვრა და გაფართოება;

2) ვარიაციის თავისუფლების ხარისხების რაოდენობის განსაზღვრა;

3) დისპერსიების და მათი შეფარდების გამოთვლა;

4) დისპერსიებისა და მათი ურთიერთობის ანალიზი;

5) საშუალებებს შორის სხვაობის მნიშვნელოვნების შეფასება და ნულოვანი ჰიპოთეზის შესამოწმებლად დასკვნების ჩამოყალიბება.

დისპერსიული ანალიზის ყველაზე შრომატევადი ნაწილია პირველი ეტაპი - ვარიაციის განსაზღვრა და დაშლა მისი ფორმირების წყაროების მიხედვით. ვარიაციის მთლიანი მოცულობის დაშლის თანმიმდევრობა დეტალურად იყო განხილული მე-5 თავში.

დისპერსიული ანალიზის ამოცანების ამოხსნის საფუძველს წარმოადგენს გაფართოების (დამატების) ვარიაციის კანონი, რომლის მიხედვითაც მიღებული ატრიბუტის მთლიანი ცვალებადობა (რყევები) იყოფა ორად: შესწავლილი ფაქტორ(ებ)ის მოქმედებით გამოწვეული ცვალებადობა. და შემთხვევითი მიზეზების მოქმედებით გამოწვეული ცვალებადობა, ანუ

დავუშვათ, რომ შესწავლილი პოპულაცია ფაქტორული მახასიათებლების მიხედვით იყოფა რამდენიმე ჯგუფად, რომელთაგან თითოეული ხასიათდება მიღებული მახასიათებლის საკუთარი საშუალო მნიშვნელობით. ამავდროულად, ამ მნიშვნელობების ცვალებადობა შეიძლება აიხსნას ორი ტიპის მიზეზით: ისინი, რომლებიც სისტემატურად მოქმედებენ ეფექტურ ნიშანზე და შეიძლება დარეგულირდნენ ექსპერიმენტის დროს, და ის, რისი რეგულირებაც შეუძლებელია. აშკარაა, რომ ჯგუფთაშორისი (ფაქტორული ან სისტემატური) ცვალებადობა, პირველ რიგში, დამოკიდებულია შესწავლილი ფაქტორის მოქმედებაზე, ხოლო შიდაჯგუფური (ნარჩენი ან შემთხვევითი) ცვალებადობა ძირითადად დამოკიდებულია შემთხვევითი ფაქტორების მოქმედებაზე.

ჯგუფურ საშუალებებს შორის განსხვავებების სანდოობის შესაფასებლად აუცილებელია ჯგუფთაშორისი და შიდაჯგუფური ვარიაციების დადგენა. თუ ჯგუფთაშორისი (ფაქტორული) ცვალებადობა მნიშვნელოვნად აღემატება შიდაჯგუფურ (ნარჩენი) ცვალებადობას, მაშინ ფაქტორმა გავლენა მოახდინა მიღებულ მახასიათებლებზე, მნიშვნელოვნად ცვლის ჯგუფის საშუალო მნიშვნელობებს. მაგრამ ჩნდება კითხვა, რა კავშირია ჯგუფთაშორის და შიდაჯგუფურ ვარიაციებს შორის, რაც შეიძლება საკმარისად ჩაითვალოს ჯგუფურ საშუალებებს შორის განსხვავებების სანდოობის (მნიშვნელოვნების) დასადგენად.

საშუალებებს შორის განსხვავებების მნიშვნელოვნების შესაფასებლად და დასკვნის ჩამოსაყალიბებლად ნულოვანი ჰიპოთეზის (H0:x1 = x2 =... =... xn) შესამოწმებლად ვარიაციულ ანალიზში გამოიყენება ერთგვარი სტანდარტი - G- კრიტერიუმი, განაწილების კანონი. რომელიც დააარსა რ.ფიშერმა. ეს კრიტერიუმი არის ორი დისპერსიის თანაფარდობა: ფაქტორული, გამომუშავებული საკვლევი ფაქტორის მოქმედებით და ნარჩენი, შემთხვევითი მიზეზების მოქმედების გამო:

დისპერსიული მიმართება Γ = £>u : ამერიკელმა სტატისტიკოსმა სნედეკორმა შესთავაზა £*2-ის აღნიშვნა ასო G-ით დისპერსიული ანალიზის გამომგონებელი რ. ფიშერის პატივსაცემად.

დისპერსიები °2 io2 არის პოპულაციის დისპერსიის შეფასება. თუ ნიმუშები დისპერსიებით °2 °2 მზადდება იმავე ზოგადი პოპულაციისგან, სადაც მნიშვნელობების ცვალებადობა იყო შემთხვევითი, მაშინ განსხვავება °2 °2 მნიშვნელობებში ასევე შემთხვევითია.

თუ ექსპერიმენტი ამოწმებს რამდენიმე ფაქტორის (A, B, C და ა.შ.) გავლენას ეფექტურ მახასიათებელზე ერთდროულად, მაშინ თითოეული მათგანის მოქმედებით გამოწვეული დისპერსიული უნდა იყოს შედარებული. °e.gP, ანუ

თუ ფაქტორის დისპერსიის მნიშვნელობა მნიშვნელოვნად აღემატება ნარჩენს, მაშინ ფაქტორმა მნიშვნელოვანი გავლენა მოახდინა მიღებულ ატრიბუტზე და პირიქით.

მულტიფაქტორულ ექსპერიმენტებში, თითოეული ფაქტორის მოქმედებით გამოწვეული ცვალებადობის გარდა, თითქმის ყოველთვის არის ვარიაცია ფაქტორების ურთიერთქმედების გამო ($ав: ^лс ^вс $ліс). ურთიერთქმედების არსი იმაში მდგომარეობს, რომ ერთი ფაქტორის ეფექტი მნიშვნელოვნად იცვლება მეორის სხვადასხვა დონეზე (მაგალითად, ნიადაგის ხარისხის ეფექტურობა სასუქების სხვადასხვა დოზით).

ფაქტორების ურთიერთქმედება ასევე უნდა შეფასდეს შესაბამისი ვარიაციების შედარებით 3 ^v.gr:

B-კრიტერიუმის ფაქტობრივი მნიშვნელობის გამოთვლისას, რაც უფრო დიდია ვარიაციები აღებული მრიცხველში, ამიტომ B > 1. ცხადია, რაც უფრო დიდია B კრიტერიუმი, მით უფრო მნიშვნელოვანი განსხვავებებია განსხვავებას შორის. თუ B = 1, მაშინ დისპერსიებში განსხვავებების მნიშვნელოვნების შეფასების საკითხი ამოღებულია.

დისპერსიების თანაფარდობის შემთხვევითი რყევების ზღვრების დასადგენად გ. ფიშერმა შეიმუშავა სპეციალური B-განაწილების ცხრილები (დანართები 4 და 5). კრიტერიუმი ფუნქციურად დაკავშირებული იქნება ალბათობასთან და დამოკიდებულია ვარიაციის თავისუფლების ხარისხების რაოდენობაზე k1და k2 ორი შედარებული ვარიაციებიდან. როგორც წესი, ორი ცხრილი გამოიყენება 0,05 და 0,01 მნიშვნელოვნების დონის კრიტერიუმის უკიდურესად მაღალი მნიშვნელობის შესახებ დასკვნების გასაკეთებლად. მნიშვნელოვნების დონე 0.05 (ან 5%) ნიშნავს, რომ 100 კრიტერიუმიდან B მხოლოდ 5 შემთხვევაში შეიძლება მიიღოს მნიშვნელობის ტოლი ან მეტი, ვიდრე ცხრილში მითითებულია. მნიშვნელოვნების დონის შემცირება 0.05-დან 0.01-მდე იწვევს კრიტერიუმის მნიშვნელობის ზრდას ორ ვარიაციებს შორის მხოლოდ შემთხვევითი მიზეზების გავლენის გამო.

კრიტერიუმის მნიშვნელობა ასევე პირდაპირ დამოკიდებულია ორი შედარებული დისპერსიის თავისუფლების ხარისხების რაოდენობაზე. თუ თავისუფლების ხარისხების რიცხვი მიისწრაფვის უსასრულობისკენ (k-me), მაშინ B თანაფარდობა ორი დისპერსიისთვის მიდრეკილია ერთიანობისკენ.

B კრიტერიუმის ტაბულური მნიშვნელობა გვიჩვენებს მოცემულ მნიშვნელოვნების დონეზე ორი ვარიაციების თანაფარდობის შესაძლო შემთხვევით მნიშვნელობას და თავისუფლების ხარისხების შესაბამის რაოდენობას თითოეული შედარებული ვარიაციებისთვის. მითითებულ ცხრილებში ნაჩვენებია B-ის მნიშვნელობა იმავე ზოგადი პოპულაციის ნიმუშებისთვის, სადაც მნიშვნელობების ცვლილების მიზეზები მხოლოდ შემთხვევითია.

Γ-ის მნიშვნელობა გვხვდება ცხრილებიდან (დანართები 4 და 5) შესაბამისი სვეტის (თავისუფლების გრადუსების რაოდენობა უფრო დიდი დისპერსიისთვის - k1) და მწკრივის (თავისუფლების გრადუსების რაოდენობა ნაკლები დისპერსიისთვის - k2) კვეთაზე. ). ასე რომ, თუ უფრო დიდი დისპერსია (მრიცხველი Г) არის k1 = 4, ხოლო პატარა ვარიაცია (მნიშვნელი Г) არის k2 = 9, მაშინ Г მნიშვნელოვნების დონეზე а = 0,05 იქნება 3,63 (დანართი 4). ასე რომ, შემთხვევითი მიზეზების შედეგად, ვინაიდან ნიმუშები მცირეა, ერთი ნიმუშის დისპერსიამ შეიძლება 5%-იანი მნიშვნელოვნების დონეზე 3,63-ჯერ გადააჭარბოს მეორე ნიმუშის დისპერსიას. როდესაც მნიშვნელოვნების დონე მცირდება 0,05-დან 0,01-მდე, G კრიტერიუმის ტაბულური მნიშვნელობა, როგორც ზემოთ აღინიშნა, გაიზრდება. ასე რომ, თავისუფლების იგივე ხარისხით k1 = 4 და k2 = 9 და a = 0.01, G კრიტერიუმის ცხრილის მნიშვნელობა იქნება 6.99 (დანართი 5).

განვიხილოთ ვარიაციის ანალიზში თავისუფლების გრადუსების რაოდენობის განსაზღვრის პროცედურა. თავისუფლების გრადუსების რაოდენობა, რომელიც შეესაბამება გადახრების კვადრატულ ჯამს, იშლება შესაბამის კომპონენტებად, ისევე როგორც კვადრატული გადახრების ჯამების დაშლისას (^სულ = No^gr + ]¥vhr), ანუ თავისუფლების ხარისხების საერთო რაოდენობა (k") იყოფა თავისუფლების ხარისხების რაოდენობად ჯგუფთაშორის (k1) და შიდაჯგუფში (k2) ვარიაციებისთვის.

ამრიგად, თუ შერჩევის პოპულაცია შედგება დაკვირვებები იყოფა ჯგუფები (ექსპერიმენტული ვარიანტების რაოდენობა) და ქვეჯგუფები (გამეორებების რაოდენობა), მაშინ თავისუფლების ხარისხების რაოდენობა k შესაბამისად იქნება:

ა) გადახრების კვადრატული ჯამისთვის (s7zag)

ბ) კვადრატული გადახრების ჯგუფთაშორისი ჯამისთვის ^ m.gP)

გ) კვადრატული გადახრების ჯგუფური ჯამისთვის v.gR)

ვარიაციების დამატების წესის მიხედვით:

მაგალითად, თუ ექსპერიმენტში ჩამოყალიბდა ექსპერიმენტის ოთხი ვარიანტი (t = 4) ხუთი გამეორებით თითოეული (n = 5), და დაკვირვებების საერთო რაოდენობა არის N = = o p = 4 * 5 = 20, მაშინ თავისუფლების გრადუსების რაოდენობა შესაბამისად უდრის:

კვადრატული გადახრების ჯამის და თავისუფლების ხარისხების რაოდენობის ცოდნით, შეგვიძლია განვსაზღვროთ მიუკერძოებელი (შესწორებული) შეფასებები სამი ვარიაციისთვის:

ნულოვანი ჰიპოთეზა H0 შემოწმებულია B კრიტერიუმის გამოყენებით ისევე, როგორც სტუდენტის t-ტესტის გამოყენებით. H0-ის შემოწმების შესახებ გადაწყვეტილების მისაღებად, აუცილებელია გამოვთვალოთ კრიტერიუმის რეალური მნიშვნელობა და შევადაროთ ცხრილის მნიშვნელობას Ba მნიშვნელოვნების მისაღები დონის a და თავისუფლების ხარისხების რაოდენობისთვის. k1და k2 ორი დისპერსიისთვის.

თუ Bfaq > Ba, მაშინ, მნიშვნელოვნების მიღებული დონის შესაბამისად, შეგვიძლია დავასკვნათ, რომ განსხვავებები ნიმუშის დისპერსიებში განისაზღვრება არა მხოლოდ შემთხვევითი ფაქტორებით; ისინი მნიშვნელოვანია. ამ შემთხვევაში, ნულოვანი ჰიპოთეზა უარყოფილია და არსებობს საფუძველი იმის დასამტკიცებლად, რომ ფაქტორი მნიშვნელოვან გავლენას ახდენს მიღებულ მახასიათებლებზე. თუ< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

დისპერსიული ანალიზის კონკრეტული მოდელის გამოყენება დამოკიდებულია როგორც შესწავლილი ფაქტორების რაოდენობაზე, ასევე შერჩევის მეთოდზე.

გ ფაქტორების რაოდენობის მიხედვით, რომლებიც განსაზღვრავენ მიღებული მახასიათებლის ცვალებადობას, ნიმუშები შეიძლება ჩამოყალიბდეს ერთი, ორი ან მეტი ფაქტორის მიხედვით. ამის მიხედვით, დისპერსიული ანალიზი იყოფა ერთფაქტორად და მრავალფაქტორად. წინააღმდეგ შემთხვევაში, მას ასევე უწოდებენ ერთფაქტორიან და მრავალფაქტორიან დისპერსიულ კომპლექსს.

მთლიანი ვარიაციის დაშლის სქემა დამოკიდებულია ჯგუფების ფორმირებაზე. ის შეიძლება იყოს შემთხვევითი (ერთი ჯგუფის დაკვირვებები არ არის დაკავშირებული მეორე ჯგუფის დაკვირვებებთან) და არა შემთხვევითი (ორი ნიმუშის დაკვირვება დაკავშირებულია ერთმანეთთან საერთო ექსპერიმენტული პირობებით). შესაბამისად მიიღება დამოუკიდებელი და დამოკიდებული ნიმუშები. დამოუკიდებელი ნიმუშები შეიძლება ჩამოყალიბდეს როგორც თანაბარი, ასევე არათანაბარი რიცხვებით. დამოკიდებული ნიმუშების ფორმირება ითვალისწინებს მათ თანაბარ ზომას.

თუ ჯგუფები ჩამოყალიბებულია შემთხვევითი თანმიმდევრობით, მაშინ მიღებული თვისების ცვალებადობის მთლიანი მოცულობა მოიცავს ფაქტორულ (ჯგუფთაშორისი) და ნარჩენ ცვალებადობას, გამეორებების ცვალებადობას, ე.ი.

პრაქტიკაში, უმეტეს შემთხვევაში აუცილებელია დამოკიდებული ნიმუშების გათვალისწინება, როდესაც ჯგუფებისა და ქვეჯგუფების პირობები გათანაბრდება. ასე რომ, საველე ექსპერიმენტში, მთელი საიტი დაყოფილია ბლოკებად, ყველაზე მრავალფეროვანი პირობებით. ამ შემთხვევაში, ექსპერიმენტის თითოეული ვარიანტი იღებს თანაბარ შესაძლებლობებს, რომ იყოს წარმოდგენილი ყველა ბლოკში, რითაც გაათანაბრდება პირობები ექსპერიმენტის ყველა შემოწმებული ვარიანტისთვის. ექსპერიმენტის აგების ამ მეთოდს რანდომიზებული ბლოკის მეთოდი ეწოდება. ანალოგიურად ტარდება ექსპერიმენტები ცხოველებთან.

დისპერსიული ანალიზის მეთოდით სოციალურ-ეკონომიკური მონაცემების დამუშავებისას აუცილებელია გავითვალისწინოთ, რომ ფაქტორების დიდი რაოდენობისა და მათი ურთიერთდამოკიდებულების გამო, ძნელია, თუნდაც პირობების ყველაზე ფრთხილად ნიველირებაში, ობიექტური ხარისხის დადგენა. თითოეული ინდივიდუალური ფაქტორის გავლენა მიღებულ მახასიათებლებზე. აქედან გამომდინარე, ნარჩენი ვარიაციის დონე განისაზღვრება არა მხოლოდ შემთხვევითი მიზეზებით, არამედ მნიშვნელოვანი ფაქტორებით, რომლებიც არ იქნა გათვალისწინებული დისპერსიული ანალიზის მოდელის აგებისას. ამის შედეგად, ნარჩენი დისპერსია, როგორც შედარების საფუძველი, ზოგჯერ ხდება არაადეკვატური მისი მიზნისთვის, ის აშკარად გადაჭარბებულია მნიშვნელობით და ვერ იმოქმედებს ფაქტორების გავლენის მნიშვნელოვნების კრიტერიუმად. ამასთან დაკავშირებით, დისპერსიული ანალიზის მოდელების აგებისას, აქტუალური ხდება ყველაზე მნიშვნელოვანი ფაქტორების შერჩევისა და თითოეული მათგანის მოქმედების გამოვლენის პირობების გათანაბრების პრობლემა. გარდა ამისა. დისპერსიული ანალიზის გამოყენება ითვალისწინებს შესწავლილი სტატისტიკური პოპულაციების ნორმალურ ან ნორმალურთან ახლოს განაწილებას. თუ ეს პირობა არ დაკმაყოფილდება, მაშინ დისპერსიის ანალიზით მიღებული შეფასებები გადაჭარბებული იქნება.

ადამიანს შეუძლია საკუთარი შესაძლებლობების ამოცნობა მხოლოდ მათი გამოყენების მცდელობით. (სენეკა)

დისპერსიის ანალიზი

შესავალი მიმოხილვა

ამ ნაწილში ჩვენ განვიხილავთ ANOVA-ს ძირითად მეთოდებს, ვარაუდებსა და ტერმინოლოგიას.

გაითვალისწინეთ, რომ ინგლისურენოვან ლიტერატურაში დისპერსიის ანალიზს ჩვეულებრივ უწოდებენ ვარიაციის ანალიზს. ამიტომ, მოკლედ, ქვემოთ ჩვენ ზოგჯერ გამოვიყენებთ ტერმინს ANOVA (ანანალიზი ვარიაცია) ჩვეულებრივი ANOVA-სთვის და ვადით მანოვავარიაციის მრავალვარიანტული ანალიზისთვის. ამ ნაწილში ჩვენ თანმიმდევრულად განვიხილავთ დისპერსიის ანალიზის ძირითად იდეებს ( ANOVA), კოვარიანტობის ანალიზი ( ANCOVA), ვარიაციის მრავალვარიანტული ანალიზი ( მანოვა) და კოვარიანტობის მრავალვარიანტული ანალიზი ( მანკოვა). კონტრასტული ანალიზისა და პოსტ-ჰოკ ტესტების უპირატესობების მოკლე განხილვის შემდეგ, მოდით გადავხედოთ დაშვებებს, რომლებზეც დაფუძნებულია ANOVA მეთოდები. ამ განყოფილების დასასრულს ახსნილია მრავალვარიანტული მიდგომის უპირატესობები განმეორებითი ზომების ანალიზისთვის ტრადიციულ ერთვარიანტულ მიდგომასთან შედარებით.

ძირითადი იდეები

დისპერსიის ანალიზის მიზანი.დისპერსიული ანალიზის მთავარი მიზანია გამოიკვლიოს საშუალებებს შორის განსხვავებების მნიშვნელობა. თავი (თავი 8) მოცემულია სტატისტიკური მნიშვნელობის შესწავლის მოკლე შესავალი. თუ თქვენ უბრალოდ ადარებთ ორი ნიმუშის საშუალებებს, დისპერსიის ანალიზი იგივე შედეგს მოგცემთ, როგორც ჩვეულებრივი ანალიზი. - ტესტი დამოუკიდებელი ნიმუშებისთვის (თუ შედარებულია ობიექტების ორი დამოუკიდებელი ჯგუფი ან დაკვირვება) ან - კრიტერიუმი დამოკიდებული ნიმუშებისთვის (თუ ორი ცვლადი შედარებულია ობიექტების ან დაკვირვებების ერთსა და იმავე კომპლექტზე). თუ არ იცნობთ ამ კრიტერიუმებს, გირჩევთ გაეცნოთ შესავალი თავის მიმოხილვას (თავი 9).

საიდან გაჩნდა სახელი დისპერსიის ანალიზი? შეიძლება უცნაურად მოგეჩვენოთ, რომ საშუალებების შედარების პროცედურას ეწოდება დისპერსიის ანალიზი. სინამდვილეში, ეს იმიტომ ხდება, რომ როდესაც ჩვენ განვიხილავთ საშუალებებს შორის განსხვავებების სტატისტიკურ მნიშვნელობას, ჩვენ რეალურად ვაანალიზებთ დისპერსიებს.

კვადრატების ჯამის დაყოფა

ნიმუშის ზომა n-სთვის, ნიმუშის დისპერსია გამოითვლება, როგორც ნიმუშის საშუალოდან კვადრატული გადახრების ჯამი გაყოფილი n-1-ზე (ნიმუშის ზომა მინუს ერთი). ამრიგად, ნიმუშის ფიქსირებული ზომის n-სთვის, დისპერსიული ფუნქციაა კვადრატების ჯამის (გადახრები), რომელიც აღინიშნება, მოკლედ, SS(ინგლისურიდან Sum of Squares - Sum of Squares). დისპერსიული ანალიზის საფუძველია დისპერსიის დაყოფა (ან დაყოფა) ნაწილებად. განვიხილოთ მონაცემთა შემდეგი ნაკრები:

ორი ჯგუფის საშუალებები მნიშვნელოვნად განსხვავდება (2 და 6, შესაბამისად). კვადრატული გადახრების ჯამი შიგნითთითოეული ჯგუფი უდრის 2-ს. მათი შეკრებით მივიღებთ 4-ს. თუ ახლა გავიმეორებთ ამ გამოთვლებს გარდაჯგუფის წევრობა, ანუ თუ გამოვთვლით SSორი ნიმუშის საერთო საშუალოზე დაყრდნობით, ჩვენ ვიღებთ 28-ს. სხვა სიტყვებით რომ ვთქვათ, დისპერსიას (კვადრატების ჯამი) ჯგუფური ცვალებადობაზე დაფუძნებული იწვევს ბევრად უფრო მცირე მნიშვნელობებს, ვიდრე საერთო ცვალებადობაზე დაყრდნობით გამოთვლილი (შედარებით საერთო საშუალო). ამის მიზეზი აშკარად არის საშუალებებს შორის მნიშვნელოვანი განსხვავება და ეს განსხვავება საშუალებებს შორის ხსნის არსებულ განსხვავებას კვადრატების ჯამებს შორის. ფაქტობრივად, თუ იყენებთ მოდულს მოცემული მონაცემების გასაანალიზებლად დისპერსიის ანალიზი, მიიღება შემდეგი შედეგები:

როგორც ცხრილიდან ჩანს, კვადრატების ჯამი SS=28 იყოფა მოცემულ კვადრატების ჯამზე შიდაჯგუფიცვალებადობა ( 2+2=4 ; იხილეთ ცხრილის მეორე სტრიქონი) და კვადრატების ჯამი საშუალო მნიშვნელობებში სხვაობის გამო. (28-(2+2)=24; იხილეთ ცხრილის პირველი სტრიქონი).

SS შეცდომები დაSS ეფექტი.ცვალებადობა ჯგუფში ( SS) ჩვეულებრივ უწოდებენ დისპერსიას შეცდომები.ეს ნიშნავს, რომ, როგორც წესი, შეუძლებელია მისი პროგნოზირება ან ახსნა, როდესაც ექსპერიმენტი ტარდება. Მეორეს მხრივ, SS ეფექტი(ან ჯგუფს შორის ცვალებადობა) შეიძლება აიხსნას საკვლევ ჯგუფებს შორის არსებული განსხვავებებით. სხვა სიტყვებით რომ ვთქვათ, გარკვეული ჯგუფის კუთვნილება განმარტავსჯგუფთაშორისი ცვალებადობა, რადგან ჩვენ ვიცით, რომ ამ ჯგუფებს განსხვავებული საშუალებები აქვთ.

მნიშვნელობის შემოწმება.სტატისტიკური მნიშვნელოვნების ტესტირების ძირითადი იდეები განხილულია თავში სტატისტიკის ძირითადი ცნებები(თავი 8). ეს თავი ასევე განმარტავს მიზეზებს, რის გამოც ბევრ ტესტში გამოიყენება ახსნილი და აუხსნელი დისპერსიის თანაფარდობა. ამ გამოყენების მაგალითია თავად დისპერსიის ანალიზი. მნიშვნელოვნების ტესტირება ANOVA-ში ეფუძნება დისპერსიის შედარებას ჯგუფთა შორის დისპერსიის გამო (ე.წ. საშუალო კვადრატული ეფექტიან ᲥᲐᲚᲑᲐᲢᲝᲜᲘეფექტი) და დისპერსიას ჯგუფური ვარიაციის გამო (ე.წ საშუალო კვადრატული შეცდომაან ᲥᲐᲚᲑᲐᲢᲝᲜᲘშეცდომა). თუ ნულოვანი ჰიპოთეზა (საშუალოების თანასწორობა ორ პოპულაციაში) მართალია, მაშინ შემთხვევითი ცვალებადობის გამო შერჩევის საშუალოდ შედარებით მცირე განსხვავებას მოელოდა. აქედან გამომდინარე, ნულოვანი ჰიპოთეზის მიხედვით, ჯგუფური დისპერსია პრაქტიკულად დაემთხვევა საერთო დისპერსიას, რომელიც გამოითვლება ჯგუფის წევრობის გათვალისწინების გარეშე. შედეგად მიღებული ჯგუფური ვარიაციები შეიძლება შევადაროთ გამოყენებით - ტესტი, რომელიც ამოწმებს არის თუ არა დისპერსიის კოეფიციენტი 1-ზე მნიშვნელოვნად. ზემოთ განხილულ მაგალითში - კრიტერიუმი აჩვენებს, რომ სხვაობა საშუალებებს შორის არის სტატისტიკურად მნიშვნელოვანი.

დისპერსიული ანალიზის ძირითადი ლოგიკა.რომ შევაჯამოთ, ANOVA-ს მიზანია საშუალოებს შორის სხვაობის სტატისტიკური მნიშვნელოვნების ტესტირება (ჯგუფებისთვის ან ცვლადებისთვის). ეს შემოწმება ხორციელდება დისპერსიის ანალიზის გამოყენებით, ე.ი. მთლიანი დისპერსიის (ვარიაციის) ნაწილებად დაყოფით, რომელთაგან ერთი განპირობებულია შემთხვევითი შეცდომით (ანუ ჯგუფური ცვალებადობით), ხოლო მეორე დაკავშირებულია საშუალო მნიშვნელობებში განსხვავებებთან. ბოლო დისპერსიული კომპონენტი გამოიყენება საშუალებებს შორის სხვაობის სტატისტიკური მნიშვნელობის გასაანალიზებლად. თუ ეს განსხვავება მნიშვნელოვანია, ნულოვანი ჰიპოთეზა უარყოფილია და მიიღება ალტერნატიული ჰიპოთეზა, რომ არსებობს განსხვავება საშუალებებს შორის.

დამოკიდებული და დამოუკიდებელი ცვლადები.ცვლადებს, რომელთა მნიშვნელობები განისაზღვრება ექსპერიმენტის დროს გაზომვებით (მაგალითად, ტესტის ქულა) ეწოდება დამოკიდებულიცვლადები. ცვლადებს, რომელთა კონტროლი შესაძლებელია ექსპერიმენტში (მაგალითად, სწავლების მეთოდები ან დაკვირვების ჯგუფებად დაყოფის სხვა კრიტერიუმები) ე.წ. ფაქტორებიან დამოუკიდებელიცვლადები. ეს ცნებები უფრო დეტალურად არის აღწერილი თავში სტატისტიკის ძირითადი ცნებები(თავი 8).

დისპერსიის მრავალვარიანტული ანალიზი

ზემოთ მოცემულ მარტივ მაგალითში, შეგიძლიათ დაუყოვნებლივ გამოთვალოთ დამოუკიდებელი ნიმუშების t-ტესტი შესაბამისი მოდულის ვარიანტის გამოყენებით ძირითადი სტატისტიკა და ცხრილები.მიღებული შედეგები ბუნებრივად დაემთხვევა დისპერსიული ანალიზის შედეგებს. თუმცა, ANOVA შეიცავს მოქნილ და ძლიერ ტექნიკას, რომელიც შეიძლება გამოყენებულ იქნას ბევრად უფრო რთული კვლევებისთვის.

ბევრი ფაქტორი.სამყარო რთული და მრავალგანზომილებიანი ბუნებით არის. უკიდურესად იშვიათია სიტუაციები, როდესაც გარკვეული ფენომენი სრულად არის აღწერილი ერთი ცვლადით. მაგალითად, თუ ვცდილობთ ვისწავლოთ დიდი პომიდვრის მოყვანა, უნდა გავითვალისწინოთ მცენარის გენეტიკურ სტრუქტურასთან, ნიადაგის ტიპთან, განათებასთან, ტემპერატურასთან და ა.შ. ამგვარად, ტიპიური ექსპერიმენტის ჩატარებისას, თქვენ უნდა გაუმკლავდეთ ფაქტორების დიდ რაოდენობას. ANOVA-ს გამოყენების მთავარი მიზეზი სასურველია ორი ნიმუშის განმეორებით შედარებაზე სხვადასხვა ფაქტორების დონეზე გამოყენებით - კრიტერიუმია, რომ დისპერსიის ანალიზი მეტია ეფექტურიდა, მცირე ნიმუშებისთვის, უფრო ინფორმაციული.

ფაქტორების მართვა.დავუშვათ, რომ ზემოთ განხილულ ორ ნიმუშიანი ანალიზის მაგალითში დავამატებთ სხვა ფაქტორს, ე.ი. სართული- სქესი. მოდით, თითოეული ჯგუფი შედგებოდეს 3 მამაკაცისა და 3 ქალისგან. ამ ექსპერიმენტის დიზაინი შეიძლება წარმოდგენილი იყოს 2-ზე 2 ცხრილის სახით:

Ექსპერიმენტი. ჯგუფი 1 Ექსპერიმენტი. ჯგუფი 2
მამაკაცები2 6
3 7
1 5
საშუალო2 6
ქალები4 8
5 9
3 7
საშუალო4 8

გამოთვლების გაკეთებამდე შეგიძლიათ შეამჩნიოთ, რომ ამ მაგალითში მთლიან დისპერსიას აქვს მინიმუმ სამი წყარო:

(1) შემთხვევითი შეცდომა (ჯგუფური დისპერსიის ფარგლებში),

(2) ცვალებადობა, რომელიც დაკავშირებულია ექსპერიმენტული ჯგუფის წევრობასთან და

(3) ცვალებადობა დაკვირვების ობიექტების სქესიდან გამომდინარე.

(გაითვალისწინეთ, რომ არსებობს ცვალებადობის სხვა შესაძლო წყარო - ფაქტორების ურთიერთქმედება, რომელზეც მოგვიანებით ვისაუბრებთ). რა მოხდება, თუ არ ჩავრთავთ იატაკისქესიროგორც ანალიზის ფაქტორი და გამოთვალეთ ჩვეული -კრიტერიუმი? თუ გამოვთვლით კვადრატების ჯამს, იგნორირება იატაკი -სქესი(ანუ სხვადასხვა სქესის ობიექტების გაერთიანება ერთ ჯგუფში ჯგუფური დისპერსიის გაანგარიშებისას, რითაც მიიღება კვადრატების ჯამი თითოეული ჯგუფისთვის ტოლი SS=10 და კვადრატების ჯამი SS= 10+10 = 20), მაშინ მივიღებთ შიდაჯგუფური დისპერსიის უფრო დიდ მნიშვნელობას, ვიდრე უფრო ზუსტი ანალიზით, ქვეჯგუფებად დამატებითი დაყოფით. ნახევრად სქესი(ამ შემთხვევაში, ჯგუფში შიგნით მყოფი საშუალო იქნება 2-ის ტოლი, ხოლო კვადრატების ჯამი შიგნით ჯგუფის ტოლი იქნება SS = 2+2+2+2 = 8). ეს განსხვავება განპირობებულია იმით, რომ საშუალო მნიშვნელობა მამაკაცები - მამრებისაშუალოზე ნაკლები ამისთვის ქალები -ქალიდა ეს განსხვავება საშუალებებში ზრდის საერთო ჯგუფში ცვალებადობას, როდესაც სქესი არ არის გათვალისწინებული. შეცდომის დისპერსიის კონტროლი ზრდის ტესტის მგრძნობელობას (ძალას).

ეს მაგალითი აჩვენებს დისპერსიული ანალიზის სხვა უპირატესობას ჩვეულებრივთან შედარებით - კრიტერიუმი ორი ნიმუშისთვის. დისპერსიის ანალიზი საშუალებას გაძლევთ შეისწავლოთ თითოეული ფაქტორი დარჩენილი ფაქტორების მნიშვნელობების კონტროლით. ეს არის, ფაქტობრივად, მისი უფრო დიდი სტატისტიკური სიმძლავრის მთავარი მიზეზი (მნიშვნელოვანი შედეგების მისაღებად საჭიროა ნიმუშის მცირე ზომები). ამ მიზეზით, დისპერსიული ანალიზი, თუნდაც მცირე ნიმუშებზე, იძლევა სტატისტიკურად უფრო მნიშვნელოვან შედეგებს, ვიდრე მარტივი - კრიტერიუმი.

ურთიერთქმედების ეფექტები

დისპერსიული ანალიზის გამოყენებას აქვს კიდევ ერთი უპირატესობა ჩვეულებრივთან შედარებით - კრიტერიუმი: დისპერსიის ანალიზი საშუალებას გვაძლევს აღმოვაჩინოთ ურთიერთქმედებაფაქტორებს შორის და შესაბამისად იძლევა უფრო რთული მოდელების შესწავლის საშუალებას. საილუსტრაციოდ, განიხილეთ სხვა მაგალითი.

ძირითადი ეფექტები, წყვილი (ორფაქტორიანი) ურთიერთქმედება.დავუშვათ, რომ არსებობს მოსწავლეთა ორი ჯგუფი და ფსიქოლოგიურად პირველი ჯგუფის მოსწავლეები გადაწყვეტილი არიან დაასრულონ დაკისრებული ამოცანები და უფრო მიზანდასახულები არიან ვიდრე მეორე ჯგუფის მოსწავლეები, რომლებიც შედგება უფრო ზარმაცი მოსწავლეებისგან. მოდით, შემთხვევით გავყოთ თითოეული ჯგუფი შუაზე და თითოეული ჯგუფის ერთ ნახევარს მივცეთ რთული დავალება, მეორე ნახევარს კი მარტივი. შემდეგ ჩვენ გავზომავთ, თუ რამდენად მუშაობენ მოსწავლეები ამ ამოცანებზე. ამ (გამოგონილი) კვლევის საშუალო მაჩვენებლები ნაჩვენებია ცხრილში:

რა დასკვნის გაკეთება შეიძლება ამ შედეგებიდან? შეგვიძლია დავასკვნათ, რომ: (1) მოსწავლეები უფრო ინტენსიურად მუშაობენ რთულ ამოცანაზე; (2) მოტივირებული სტუდენტები უფრო მეტს მუშაობენ, ვიდრე ზარმაცი? არცერთი ეს განცხადება არ ასახავს ცხრილში ნაჩვენები საშუალებების სისტემატური ბუნების არსს. შედეგების გაანალიზებისას უფრო სწორი იქნება იმის თქმა, რომ მხოლოდ მოტივირებული მოსწავლეები მუშაობენ რთულ ამოცანებზე, ხოლო მხოლოდ ზარმაცი მოსწავლეები მუშაობენ რთულ ამოცანებზე. ანუ მოსწავლეთა ხასიათი და დავალების სირთულე ურთიერთქმედებაგავლენას ახდენენ ერთმანეთზე დახარჯულ ძალისხმევაზე. ეგ არის მაგალითი წყვილის ურთიერთქმედებამოსწავლეთა ხასიათსა და დავალების სირთულეს შორის. გაითვალისწინეთ, რომ 1 და 2 განცხადებები აღწერს ძირითადი ეფექტები.

უმაღლესი დონის ურთიერთქმედებები.მიუხედავად იმისა, რომ წყვილთა შორის ურთიერთქმედებები ჯერ კიდევ შედარებით მარტივი ასახსნელია, უფრო მაღალი რიგის ურთიერთქმედებების ახსნა გაცილებით რთულია. წარმოვიდგინოთ, რომ ზემოთ განხილულ მაგალითში სხვა ფაქტორია შემოტანილი იატაკი -სქესიდა მივიღეთ საშუალოების შემდეგი ცხრილი:

რა დასკვნების გამოტანა შეიძლება ახლა მიღებული შედეგებიდან? საშუალო ნაკვეთები აადვილებს რთული ეფექტების ინტერპრეტაციას. ANOVA მოდული საშუალებას გაძლევთ შექმნათ ეს გრაფიკები მაუსის თითქმის ერთი დაწკაპუნებით.

ქვემოთ მოცემულ დიაგრამებზე გამოსახულება წარმოადგენს შესწავლილ სამფაქტორიან ურთიერთქმედებას.

გრაფიკების დათვალიერებისას შეგვიძლია ვთქვათ, რომ ქალებისთვის არის ურთიერთქმედება პიროვნებასა და ტესტის სირთულეს შორის: მოტივირებული ქალები უფრო მეტად მუშაობენ რთულ ამოცანაზე, ვიდრე მარტივზე. მამაკაცებისთვის იგივე ურთიერთქმედება საპირისპიროა. ჩანს, რომ ფაქტორებს შორის ურთიერთქმედების აღწერა უფრო დამაბნეველი ხდება.

ურთიერთქმედების აღწერის ზოგადი გზა.ზოგადად, ფაქტორებს შორის ურთიერთქმედება აღწერილია, როგორც ერთი ეფექტის ცვლილება მეორის გავლენის ქვეშ. ზემოთ განხილულ მაგალითში ორფაქტორიანი ურთიერთქმედება შეიძლება შეფასდეს, როგორც ამოცანის სირთულის დამახასიათებელი ფაქტორის ძირითადი ეფექტის ცვლილება მოსწავლის ხასიათის აღმწერი ფაქტორის გავლენის ქვეშ. წინა აბზაციდან სამი ფაქტორის ურთიერთქმედებისთვის შეგვიძლია ვთქვათ, რომ ორი ფაქტორის (დავალების სირთულე და მოსწავლის ხასიათი) ურთიერთქმედება იცვლება გავლენის ქვეშ. სქესისქესი. თუ ოთხი ფაქტორის ურთიერთქმედება შესწავლილია, შეგვიძლია ვთქვათ, რომ სამი ფაქტორის ურთიერთქმედება იცვლება მეოთხე ფაქტორის გავლენით, ე.ი. მეოთხე ფაქტორის სხვადასხვა დონეზე არსებობს სხვადასხვა ტიპის ურთიერთქმედება. გამოდის, რომ ბევრ სფეროში ხუთი ან კიდევ მეტი ფაქტორის ურთიერთქმედება უჩვეულო არ არის.

რთული გეგმები

ჯგუფურ და ჯგუფურ დიზაინებს შორის (განმეორებითი ზომების დიზაინი)

ორი განსხვავებული ჯგუფის შედარებისას ჩვეულებრივ გამოიყენება - დამოუკიდებელი ნიმუშების კრიტერიუმი (მოდულიდან ძირითადი სტატისტიკა და ცხრილები). როდესაც ორი ცვლადი შედარებულია ობიექტების ერთსა და იმავე კომპლექტზე (დაკვირვებებზე), ის გამოიყენება -დამოკიდებული ნიმუშების კრიტერიუმი. დისპერსიის ანალიზისთვის ასევე მნიშვნელოვანია, არის თუ არა ნიმუშები დამოკიდებული. თუ არსებობს ერთი და იგივე ცვლადების განმეორებითი გაზომვები (განსხვავებულ პირობებში ან სხვადასხვა დროს) იგივე ობიექტებისთვის, შემდეგ ისინი საუბრობენ ყოფნაზე განმეორებითი ზომების ფაქტორი(ასევე ე.წ შიდაჯგუფური ფაქტორი,ვინაიდან კვადრატების შიგნით ჯგუფის ჯამი გამოითვლება მისი მნიშვნელობის შესაფასებლად). თუ შევადარებთ ობიექტების სხვადასხვა ჯგუფებს (მაგალითად, მამაკაცები და ქალები, ბაქტერიების სამი შტამი და ა.შ.), მაშინ აღწერილია განსხვავება ჯგუფებს შორის. ჯგუფთაშორისი ფაქტორი.ორი აღწერილი ტიპის ფაქტორების მნიშვნელობის კრიტერიუმების გამოთვლის მეთოდები განსხვავებულია, მაგრამ მათი ზოგადი ლოგიკა და ინტერპრეტაციები ერთი და იგივეა.

ჯგუფთაშორისი და შიდა გეგმები.ხშირ შემთხვევაში, ექსპერიმენტი მოითხოვს დიზაინში როგორც საგნებს შორის, ასევე განმეორებითი ზომების ფაქტორის ჩართვას. მაგალითად, იზომება ქალი და მამაკაცი სტუდენტების მათემატიკური უნარები (სად იატაკი -სქესი-ჯგუფთაშორისი ფაქტორი) სემესტრის დასაწყისში და ბოლოს. თითოეული მოსწავლის უნარების ორი საზომი ქმნის ჯგუფურ ფაქტორს (განმეორებითი ზომების ფაქტორი). ძირითადი ეფექტებისა და ურთიერთქმედებების ინტერპრეტაცია სუბიექტებს შორის და განმეორებითი ღონისძიების ფაქტორებისთვის თანმიმდევრულია და ორივე ტიპის ფაქტორს აშკარად შეუძლია ურთიერთქმედება ერთმანეთთან (მაგ., ქალები იძენენ უნარებს სემესტრის განმავლობაში, ხოლო მამაკაცები კარგავენ).

არასრული (ბუდებული) გეგმები

ხშირ შემთხვევაში ურთიერთქმედების ეფექტის უგულებელყოფა შეიძლება. ეს ხდება ან მაშინ, როდესაც ცნობილია, რომ არ არსებობს ურთიერთქმედების ეფექტი პოპულაციაში, ან როდესაც ხორციელდება სრული ფაქტორულიგეგმა შეუძლებელია. მაგალითად, შესწავლილია საწვავის ოთხი დანამატის გავლენა საწვავის მოხმარებაზე. შერჩეულია ოთხი მანქანა და ოთხი მძღოლი. სრული ფაქტორულიექსპერიმენტი მოითხოვს, რომ ყოველი კომბინაცია: დანამატი, მძღოლი, მანქანა - ერთხელ მაინც გამოჩნდეს. ეს მოითხოვს მინიმუმ 4 x 4 x 4 = 64 ტესტების ჯგუფს, რაც ძალიან შრომატევადია. გარდა ამისა, ნაკლებად სავარაუდოა, რომ იყოს რაიმე ურთიერთქმედება მძღოლსა და საწვავის დანამატს შორის. ამის გათვალისწინებით, შეგიძლიათ გამოიყენოთ გეგმა ლათინური კვადრატები,რომელიც შეიცავს მხოლოდ 16 ტესტის ჯგუფს (ოთხი დანამატი აღინიშნება ასოებით A, B, C და D):

ლათინური კვადრატები აღწერილია უმეტეს წიგნებში ექსპერიმენტული დიზაინის შესახებ (მაგ., Hays, 1988; Lindman, 1974; Milliken and Johnson, 1984; Winer, 1962) და აქ დეტალურად არ იქნება განხილული. გაითვალისწინეთ, რომ ლათინური კვადრატებია არასავსედიზაინები, რომლებშიც არ შედის ფაქტორების დონის ყველა კომბინაცია. მაგალითად, მძღოლი 1 მართავს მანქანა 1 მხოლოდ დანამატით A, მძღოლი 3 მართავს მანქანა 1 მხოლოდ დანამატით C. ფაქტორის დონეები დანამატები ( A, B, C და D) მოთავსებულია ცხრილის უჯრედებში ავტომობილი x მძღოლი -როგორც კვერცხები ბუდეებში. ეს მნემონიკა სასარგებლოა ბუნების გასაგებად მობუდული ან მობუდულიგეგმები. მოდული დისპერსიის ანალიზიგთავაზობთ მარტივ გზებს ამ ტიპის გეგმების გასაანალიზებლად.

კოვარიანტული ანალიზი

მთავარი იდეა

თავში ძირითადი იდეებიმოკლედ განიხილეს ფაქტორების კონტროლის იდეა და როგორ ამცირებს დანამატის ფაქტორების ჩართვას კვადრატული შეცდომების ჯამს და ზრდის დიზაინის სტატისტიკურ ძალას. ეს ყველაფერი შეიძლება გაფართოვდეს ცვლადებზე მნიშვნელობების უწყვეტი ნაკრებით. როდესაც ასეთი უწყვეტი ცვლადები შედის დიზაინში ფაქტორებად, მათ უწოდებენ კოვარიატები.

ფიქსირებული კოვარიატები

დავუშვათ, ჩვენ ვადარებთ მოსწავლეთა ორი ჯგუფის მათემატიკურ უნარებს, რომლებსაც ასწავლიდნენ ორი განსხვავებული სახელმძღვანელოს გამოყენებით. მოდით ასევე დავუშვათ, რომ ინტელექტის კოეფიციენტის (IQ) მონაცემები ხელმისაწვდომია თითოეული მოსწავლისთვის. შეგიძლიათ ჩათვალოთ, რომ IQ დაკავშირებულია მათემატიკის უნარებთან და გამოიყენოთ ეს ინფორმაცია. მოსწავლეთა ორი ჯგუფიდან თითოეულისთვის შეიძლება გამოითვალოს IQ-სა და მათემატიკის უნარებს შორის კორელაციის კოეფიციენტი. ამ კორელაციის კოეფიციენტის გამოყენებით, შესაძლებელია ჯგუფებში ვარიაციის პროპორციის იზოლირება, რომელიც აიხსნება IQ-ის გავლენით და ვარიაციის აუხსნელი პროპორციით (იხ. სტატისტიკის ძირითადი ცნებები(თავი 8) და ძირითადი სტატისტიკა და ცხრილები(თავი 9)). დისპერსიის დარჩენილი ნაწილი გამოიყენება ანალიზში შეცდომის დისპერსიის სახით. თუ არსებობს კორელაცია IQ-სა და მათემატიკის უნარებს შორის, მაშინ შეცდომის ვარიაცია შეიძლება მნიშვნელოვნად შემცირდეს. SS/ (n-1) .

კოვარიატების გავლენაF- კრიტერიუმი. F-კრიტერიუმი აფასებს ჯგუფებში საშუალო მნიშვნელობების სხვაობის სტატისტიკურ მნიშვნელობას და გამოითვლება ჯგუფთაშორისი ვარიაციის თანაფარდობა ( ᲥᲐᲚᲑᲐᲢᲝᲜᲘეფექტი) შეცდომის დისპერსიამდე ( ᲥᲐᲚᲑᲐᲢᲝᲜᲘშეცდომა) . თუ ᲥᲐᲚᲑᲐᲢᲝᲜᲘშეცდომამცირდება, მაგალითად, IQ ფაქტორის გათვალისწინებით, მნიშვნელობა იზრდება.

ბევრი კოვარიატი.ზემოთ გამოყენებული მსჯელობა ერთი კოვარიატისთვის (IQ) ადვილად შეიძლება გავრცელდეს მრავალ კოვარიატზე. მაგალითად, IQ-ის გარდა, შეგიძლიათ მოტივაციის გაზომვები, სივრცითი აზროვნება და ა.შ. ჩვეულებრივი კორელაციის კოეფიციენტის ნაცვლად გამოიყენება მრავალჯერადი კორელაციის კოეფიციენტი.

როდესაც ღირებულება - კრიტერიუმები მცირდება.ზოგჯერ ექსპერიმენტულ დიზაინში კოვარიატების შეყვანა ამცირებს მნიშვნელობას - კრიტერიუმები . ეს ჩვეულებრივ მიუთითებს იმაზე, რომ კოვარიატები დაკავშირებულია არა მხოლოდ დამოკიდებულ ცვლადთან (მაგ., მათემატიკის უნარებთან), არამედ ფაქტორებთან (მაგ., სხვადასხვა სახელმძღვანელოებთან). დავუშვათ, რომ ინტელექტის კოეფიციენტი იზომება სემესტრის ბოლოს, სტუდენტთა ორი ჯგუფის ორი განსხვავებული სახელმძღვანელოს გამოყენებით სწავლების თითქმის ერთი წლის შემდეგ. მიუხედავად იმისა, რომ მოსწავლეები დანაწილდნენ ჯგუფებში შემთხვევით, შესაძლოა, სახელმძღვანელოებში განსხვავებები იმდენად დიდია, რომ IQ და მათემატიკის უნარები მნიშვნელოვნად განსხვავდებოდეს ჯგუფებს შორის. ამ შემთხვევაში, კოვარიატები არა მხოლოდ ამცირებენ შეცდომის დისპერსიას, არამედ ჯგუფურ დისპერსიას. სხვა სიტყვებით რომ ვთქვათ, ჯგუფებში IQ-ში განსხვავებების კონტროლის შემდეგ, მათემატიკის უნარებში განსხვავება აღარ არის მნიშვნელოვანი. შეგიძლია სხვანაირად თქვა. IQ-ის გავლენის „გამორიცხვის“ შემდეგ, უნებლიედ გამოირიცხება სახელმძღვანელოს გავლენა მათემატიკური უნარების განვითარებაზე.

მორგებული საშუალოები.როდესაც კოვარიატი გავლენას ახდენს საგნებს შორის ფაქტორზე, უნდა გამოვთვალოთ მორგებული საშუალებები, ე.ი. ის საშუალებები, რომლებიც მიიღება ყველა კოვარიატიული შეფასების ამოღების შემდეგ.

ურთიერთქმედება კოვარიატებსა და ფაქტორებს შორის.ისევე, როგორც ფაქტორებს შორის ურთიერთქმედების შესწავლა ხდება, ასევე შეიძლება შეისწავლოს ურთიერთქმედება კოვარიატებსა და ფაქტორთა ჯგუფებს შორის. ვთქვათ, ერთ-ერთი სახელმძღვანელო განსაკუთრებით შეეფერება ჭკვიან მოსწავლეებს. მეორე სახელმძღვანელო ჭკვიანი მოსწავლეებისთვის მოსაწყენია და იგივე სახელმძღვანელო რთულია ნაკლებად ჭკვიანი სტუდენტებისთვის. შედეგად, პირველ ჯგუფში IQ-სა და სწავლის შედეგს შორის დადებითი კორელაციაა (უფრო ჭკვიანი მოსწავლეები, უკეთესი შედეგები) და ნულოვანი ან ოდნავ უარყოფითი კორელაცია მეორე ჯგუფში (რაც უფრო ჭკვიანია მოსწავლე, მით ნაკლებია მათემატიკური უნარების შეძენის ალბათობა. მეორე სახელმძღვანელოდან). ზოგიერთი კვლევა განიხილავს ამ სიტუაციას, როგორც კოვარიანტული ანალიზის დაშვებების დარღვევის მაგალითს. თუმცა, იმის გამო, რომ ANOVA მოდული იყენებს კოვარიანტობის ანალიზის ყველაზე გავრცელებულ მეთოდებს, შესაძლებელია, კერძოდ, შეფასდეს ფაქტორებსა და კოვარიატებს შორის ურთიერთქმედების სტატისტიკური მნიშვნელოვნება.

ცვლადი კოვარიატები

მიუხედავად იმისა, რომ ფიქსირებული კოვარიატები საკმაოდ ხშირად განიხილება სახელმძღვანელოებში, ცვლადი კოვარიატები მოხსენიებულია ბევრად უფრო იშვიათად. როგორც წესი, განმეორებითი გაზომვებით ექსპერიმენტების ჩატარებისას ჩვენ გვაინტერესებს განსხვავებები ერთი და იგივე რაოდენობის გაზომვებში დროის სხვადასხვა მომენტში. კერძოდ, ჩვენ გვაინტერესებს ამ განსხვავებების მნიშვნელობა. თუ კოვარიატები იზომება ერთდროულად დამოკიდებული ცვლადების გაზომვებთან, შეიძლება გამოითვალოს კორელაცია კოვარიატსა და დამოკიდებულ ცვლადს შორის.

მაგალითად, მათემატიკის ინტერესი და მათემატიკური უნარები შეიძლება გამოვიკვლიოთ სემესტრის დასაწყისში და ბოლოს. საინტერესო იქნებოდა იმის შემოწმება, არის თუ არა მათემატიკისადმი ინტერესის ცვლილებები კორელაციაში მათემატიკური უნარების ცვლილებებთან.

მოდული დისპერსიის ანალიზისტატისტიკაავტომატურად აფასებს კოვარიატების ცვლილებების სტატისტიკურ მნიშვნელობას დიზაინში, სადაც ეს შესაძლებელია.

მრავალვარიანტული კონსტრუქციები: დისპერსიისა და კოვარიანტობის მრავალვარიანტული ანალიზი

ჯგუფთაშორისი გეგმები

ადრე განხილული ყველა მაგალითი მოიცავდა მხოლოდ ერთ დამოკიდებულ ცვლადს. როდესაც ერთდროულად რამდენიმე დამოკიდებული ცვლადია, იზრდება მხოლოდ გამოთვლების სირთულე, მაგრამ შინაარსი და ძირითადი პრინციპები არ იცვლება.

მაგალითად, კვლევა ტარდება ორ სხვადასხვა სახელმძღვანელოზე. პარალელურად იკვლევენ მოსწავლეთა წარმატებას ფიზიკა-მათემატიკის შესწავლაში. ამ შემთხვევაში, არსებობს ორი დამოკიდებული ცვლადი და თქვენ უნდა გაარკვიოთ, როგორ მოქმედებს მათზე ორი განსხვავებული სახელმძღვანელო ერთდროულად. ამისათვის შეგიძლიათ გამოიყენოთ დისპერსიის მრავალვარიანტული ანალიზი (MANOVA). ერთგანზომილებიანის ნაცვლად კრიტერიუმი, მრავალგანზომილებიანი გამოიყენება ტესტი (Wilks' l test), რომელიც დაფუძნებულია შეცდომის კოვარიანსის მატრიცისა და ჯგუფთაშორისი კოვარიანტობის მატრიცის შედარების საფუძველზე.

თუ დამოკიდებული ცვლადები ერთმანეთთან კორელაციაშია, მაშინ ეს კორელაცია მხედველობაში უნდა იქნას მიღებული მნიშვნელოვნების კრიტერიუმის გაანგარიშებისას. ცხადია, თუ ერთი და იგივე გაზომვა ორჯერ განმეორდება, მაშინ ახალი ვერაფერი მიიღება. თუ კორელირებული განზომილება დაემატება არსებულ განზომილებას, მიიღება ახალი ინფორმაცია, მაგრამ ახალი ცვლადი შეიცავს ზედმეტ ინფორმაციას, რომელიც აისახება ცვლადებს შორის კოვარიანტში.

შედეგების ინტერპრეტაცია.თუ მთლიანი მრავალვარიანტული ტესტი მნიშვნელოვანია, შეგვიძლია დავასკვნათ, რომ შესაბამისი ეფექტი (მაგ. სახელმძღვანელოს ტიპი) მნიშვნელოვანია. თუმცა ჩნდება შემდეგი კითხვები. მოქმედებს თუ არა სახელმძღვანელოს ტიპი მხოლოდ მათემატიკის უნარების გაუმჯობესებაზე, მხოლოდ ფიზიკურ უნარებზე ან ორივე უნარზე? ფაქტობრივად, მნიშვნელოვანი მრავალვარიანტული ტესტის მიღების შემდეგ, უნივარიატული ტესტი განიხილება ინდივიდუალური ძირითადი ეფექტის ან ურთიერთქმედებისთვის. კრიტერიუმი. სხვა სიტყვებით რომ ვთქვათ, დამოკიდებული ცვლადები, რომლებიც ხელს უწყობენ მრავალვარიანტული ტესტის მნიშვნელობას, ცალკე განიხილება.

განმეორებითი ზომების დიზაინი

თუ მოსწავლეთა მათემატიკისა და ფიზიკის უნარები ფასდება სემესტრის დასაწყისში და ბოლოს, მაშინ ეს არის განმეორებითი საზომები. ასეთ გეგმებში მნიშვნელობის კრიტერიუმის შესწავლა არის ერთგანზომილებიანი შემთხვევის ლოგიკური განვითარება. გაითვალისწინეთ, რომ დისპერსიის მრავალვარიანტული ანალიზის ტექნიკა ასევე ჩვეულებრივ გამოიყენება ორზე მეტი დონის მქონე განმეორებითი ცვალებადობის ფაქტორების მნიშვნელობის შესამოწმებლად. შესაბამისი აპლიკაციები მოგვიანებით განიხილება ამ ნაწილში.

ცვლადის მნიშვნელობების ჯამი და ვარიაციის მრავალვარიანტული ანალიზი

ცვლადის უნივარიატიული და მრავალვარიანტული ანალიზის გამოცდილ მომხმარებლებსაც კი ხშირად უჭირთ სხვადასხვა შედეგების მიღება ვარიაციის მრავალვარიანტული ანალიზის გამოყენებისას, მაგალითად, სამ ცვლადზე და როდესაც ცვლადის ცვლადი ცვლადის ცვლადი ამ სამი ცვლადის ჯამზე გამოიყენება, თითქოს ეს. იყო ერთი ცვლადი.

იდეა შეჯამებაცვლადები არის ის, რომ თითოეული ცვლადი შეიცავს გარკვეულ ნამდვილ ცვლადს, რომელიც შესწავლილია, ისევე როგორც შემთხვევითი გაზომვის შეცდომა. ამიტომ, ცვლადების მნიშვნელობების საშუალოდ გაანგარიშებისას, გაზომვის შეცდომა ყველა გაზომვისთვის უფრო ახლოს იქნება 0-თან და საშუალო მნიშვნელობები უფრო საიმედო იქნება. სინამდვილეში, ამ შემთხვევაში, ANOVA-ს გამოყენება ცვლადების ჯამზე გონივრული და ძლიერი ტექნიკაა. თუმცა, თუ დამოკიდებული ცვლადები ბუნებით მრავალგანზომილებიანია, ცვლადების მნიშვნელობების შეჯამება შეუსაბამოა.

მაგალითად, დაე, დამოკიდებული ცვლადები შედგებოდეს ოთხი ინდიკატორისგან წარმატება საზოგადოებაში. თითოეული მაჩვენებელი ახასიათებს ადამიანის საქმიანობის სრულიად დამოუკიდებელ ასპექტს (მაგალითად, პროფესიული წარმატება, წარმატება ბიზნესში, ოჯახის კეთილდღეობა და ა.შ.). ამ ცვლადების დამატება ვაშლის და ფორთოხლის დამატებას ჰგავს. ამ ცვლადების ჯამი არ იქნება შესაბამისი ერთგანზომილებიანი საზომი. ამიტომ, ასეთი მონაცემები უნდა განიხილებოდეს, როგორც მრავალგანზომილებიანი ინდიკატორები დისპერსიის მრავალვარიანტული ანალიზი.

კონტრასტული ანალიზი და პოსტ ჰოკ ტესტები

რატომ არის შედარებული საშუალოების ცალკეული ნაკრები?

როგორც წესი, ჰიპოთეზები ექსპერიმენტული მონაცემების შესახებ ფორმულირებულია არა უბრალოდ ძირითადი ეფექტების ან ურთიერთქმედების თვალსაზრისით. მაგალითი იქნება ეს ჰიპოთეზა: გარკვეული სახელმძღვანელო აუმჯობესებს მათემატიკის უნარებს მხოლოდ მამრობითი სქესის მოსწავლეებში, ხოლო სხვა სახელმძღვანელო დაახლოებით ერთნაირად ეფექტურია ორივე სქესისთვის, მაგრამ მაინც ნაკლებად ეფექტურია მამაკაცებისთვის. შეიძლება ვიწინასწარმეტყველოთ, რომ სახელმძღვანელოების ეფექტურობა ურთიერთქმედებს სტუდენტის სქესთან. თუმცა, ეს პროგნოზიც მოქმედებს ბუნებაურთიერთქმედებები. სქესებს შორის მნიშვნელოვანი განსხვავებაა მოსალოდნელი სტუდენტებისთვის, რომლებიც იყენებენ ერთ წიგნს და პრაქტიკულად დამოუკიდებელი შედეგები სქესის მიხედვით სტუდენტებისთვის, რომლებიც იყენებენ მეორე წიგნს. ამ ტიპის ჰიპოთეზა ჩვეულებრივ განიხილება კონტრასტული ანალიზის გამოყენებით.

კონტრასტების ანალიზი

მოკლედ, კონტრასტული ანალიზი საშუალებას გაძლევთ შეაფასოთ რთული ეფექტების გარკვეული ხაზოვანი კომბინაციების სტატისტიკური მნიშვნელობა. კონტრასტული ანალიზი ნებისმიერი რთული ANOVA გეგმის მთავარი და სავალდებულო ელემენტია. მოდული დისპერსიის ანალიზიაქვს საკმაოდ მრავალფეროვანი კონტრასტული ანალიზის შესაძლებლობები, რაც საშუალებას გაძლევთ გამოყოთ და გაანალიზოთ საშუალებების ნებისმიერი ტიპის შედარება.

A posterioriშედარებები

ზოგჯერ, ექსპერიმენტის დამუშავების შედეგად, მოულოდნელი ეფექტი ვლინდება. მიუხედავად იმისა, რომ უმეტეს შემთხვევაში შემოქმედებითი მკვლევარი შეძლებს რაიმე შედეგის ახსნას, ეს არ იძლევა შემდგომი ანალიზისა და წინასწარმეტყველების შეფასების საშუალებას. ეს პრობლემა ერთ-ერთია, რისთვისაც a posteriori კრიტერიუმები, ანუ კრიტერიუმები, რომლებიც არ გამოიყენება აპრიორიჰიპოთეზები. საილუსტრაციოდ, განიხილეთ შემდეგი ექსპერიმენტი. დავუშვათ, რომ არის 100 ბარათი, რომელიც შეიცავს 1-დან 10-მდე რიცხვებს. ყველა ამ კარტს სათაურში ჩავსვამთ, შემთხვევით ვირჩევთ 5 ბარათს 20-ჯერ და გამოვთვლით საშუალო მნიშვნელობას (ბარათებზე დაწერილი რიცხვების საშუალოს) თითოეული ნიმუშისთვის. შეგიძლიათ ველოდოთ, რომ იქნება ორი ნიმუში, რომელთა საშუალებები მნიშვნელოვნად განსხვავდება? ეს ძალიან დამაჯერებელია! ორი ნიმუშის არჩევით მაქსიმალური და მინიმალური საშუალოებით, შეგიძლიათ მიიღოთ საშუალებებში განსხვავება, რომელიც ძალიან განსხვავდება საშუალების სხვაობისგან, მაგალითად, პირველი ორი ნიმუშის. ეს განსხვავება შეიძლება გამოვიკვლიოთ, მაგალითად, კონტრასტული ანალიზის გამოყენებით. დეტალებში ჩასვლის გარეშე არსებობს რამდენიმე ე.წ უკანა მხარესკრიტერიუმები, რომლებიც დაფუძნებულია ზუსტად პირველ სცენარზე (ექსტრემალური საშუალებების აღება 20 ნიმუშიდან), ანუ ეს კრიტერიუმები ეფუძნება ყველაზე განსხვავებული საშუალებების არჩევას დიზაინში ყველა საშუალების შესადარებლად. ეს კრიტერიუმები გამოიყენება იმის უზრუნველსაყოფად, რომ ხელოვნური ეფექტი არ არის მიღებული მხოლოდ შემთხვევით, მაგალითად, საშუალებებს შორის მნიშვნელოვანი განსხვავების გამოსავლენად, როდესაც არ არსებობს. მოდული დისპერსიის ანალიზიგთავაზობთ ასეთი კრიტერიუმების ფართო სპექტრს. როდესაც მოულოდნელ შედეგებს აწყდებიან ექსპერიმენტში, რომელიც მოიცავს რამდენიმე ჯგუფს, მაშინ უკანა მხარესმიღებული შედეგების სტატისტიკური მნიშვნელოვნების შემოწმების პროცედურები.

I, II, III და IV ტიპის კვადრატების ჯამი

მრავალვარიანტული რეგრესია და დისპერსიის ანალიზი

მჭიდრო კავშირია მრავალვარიანტული რეგრესიის მეთოდსა და დისპერსიის ანალიზს შორის (ვარიანსის ანალიზი). ორივე მეთოდით შესწავლილია ხაზოვანი მოდელი. მოკლედ, თითქმის ყველა ექსპერიმენტული დიზაინის შესწავლა შესაძლებელია მრავალვარიანტული რეგრესიის გამოყენებით. განვიხილოთ შემდეგი მარტივი ინტერჯგუფური 2 x 2 დიზაინი.

დ.ვ. AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

A და B სვეტები შეიცავს კოდებს, რომლებიც ახასიათებენ A და B ფაქტორების დონეებს, სვეტი AxB შეიცავს ორი A და B სვეტის ნამრავლს. ჩვენ შეგვიძლია გავაანალიზოთ ეს მონაცემები მრავალვარიანტული რეგრესიის გამოყენებით. ცვლადი დ.ვ.განისაზღვრება, როგორც დამოკიდებული ცვლადი, ცვლადები საწყისი ადრე AxBროგორც დამოუკიდებელი ცვლადები. რეგრესიის კოეფიციენტებისთვის მნიშვნელოვნების შესწავლა დაემთხვევა გამოთვლებს ფაქტორების ძირითადი ეფექტების მნიშვნელოვნების დისპერსიის ანალიზში. და და ურთიერთქმედების ეფექტი AxB.

გაუწონასწორებელი და დაბალანსებული გეგმები

კორელაციის მატრიცის გაანგარიშებისას ყველა ცვლადისთვის, როგორიცაა ზემოთ ასახული მონაცემები, შეამჩნევთ, რომ ფაქტორების ძირითადი ეფექტი და და ურთიერთქმედების ეფექტი AxBარაკორელირებული. ეფექტების ამ თვისებას ორთოგონალობასაც უწოდებენ. ისინი ამბობენ, რომ ეფექტი და - ორთოგონალურიან დამოუკიდებელიერთმანეთისგან. თუ გეგმის ყველა ეფექტი ორთოგონალურია ერთმანეთთან, როგორც ზემოთ მოცემულ მაგალითში, მაშინ გეგმა ითვლება დაბალანსებული.

დაბალანსებულ გეგმებს აქვთ "კარგი ქონება". ასეთი გეგმების ანალიზის გამოთვლები ძალიან მარტივია. ყველა გამოთვლა ემყარება ეფექტებსა და დამოკიდებულ ცვლადებს შორის კორელაციის გამოთვლას. ვინაიდან ეფექტები არის ორთოგონალური, ნაწილობრივი კორელაციები (როგორც სრულად მრავალგანზომილებიანირეგრესიები) არ არის გათვლილი. თუმცა, რეალურ ცხოვრებაში გეგმები ყოველთვის არ არის დაბალანსებული.

განვიხილოთ რეალური მონაცემები უჯრედებში დაკვირვებების არათანაბარი რაოდენობით.

ფაქტორი ა ფაქტორი B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

თუ ჩვენ ამ მონაცემებს ზემოთ დავწერთ და ყველა ცვლადის კორელაციის მატრიცას გამოვთვლით, აღმოვაჩენთ, რომ დიზაინის ფაქტორები ერთმანეთთან არის დაკავშირებული. გეგმაში ფაქტორები აღარ არის ორთოგონალური და ასეთ გეგმებს უწოდებენ გაუწონასწორებელი.გაითვალისწინეთ, რომ განხილულ მაგალითში, ფაქტორებს შორის კორელაცია მთლიანად განპირობებულია მონაცემთა მატრიცის სვეტებში 1 და -1 სიხშირეების სხვაობით. სხვა სიტყვებით რომ ვთქვათ, უჯრედების არათანაბარი მოცულობების მქონე ექსპერიმენტული დიზაინი (უფრო ზუსტად, არაპროპორციული მოცულობით) იქნება გაუწონასწორებელი, რაც ნიშნავს, რომ ძირითადი ეფექტები და ურთიერთქმედებები დაბნეული იქნება. ამ შემთხვევაში, სრული მრავალვარიანტული რეგრესია უნდა გამოითვალოს ეფექტების სტატისტიკური მნიშვნელობის გამოსათვლელად. აქ რამდენიმე სტრატეგიაა.

I, II, III და IV ტიპის კვადრატების ჯამი

კვადრატების ტიპის ჯამიმედაIII. მულტივარიანტულ მოდელში თითოეული ფაქტორის მნიშვნელობის შესამოწმებლად, თითოეული ფაქტორის ნაწილობრივი კორელაცია შეიძლება გამოითვალოს, იმ პირობით, რომ ყველა სხვა ფაქტორი უკვე გათვალისწინებულია მოდელში. თქვენ ასევე შეგიძლიათ შეიყვანოთ ფაქტორები მოდელში ეტაპობრივად, მოდელში უკვე შეყვანილი ყველა ფაქტორის აღრიცხვა და ყველა სხვა ფაქტორების იგნორირება. ზოგადად, ეს არის განსხვავება ტიპი IIIდა ტიპიმეკვადრატების ჯამი (ეს ტერმინოლოგია დაინერგა SAS-ში, იხილეთ, მაგალითად, SAS, 1982; დეტალური განხილვა ასევე შეგიძლიათ იხილოთ Searle, 1987, გვ. 461; Woodward, Bonett, and Brecht, 1990, გვ. 216; ან Milliken და ჯონსონი, 1984, გვ. 138).

კვადრატების ტიპის ჯამიII.შემდეგი „შუალედური“ მოდელის ფორმირების სტრატეგია შედგება: ყველა ძირითადი ეფექტის კონტროლი ერთი ძირითადი ეფექტის მნიშვნელობის შესწავლისას; ყველა ძირითადი ეფექტისა და ყველა წყვილური ურთიერთქმედების კონტროლისას ინდივიდუალური წყვილური ურთიერთქმედების მნიშვნელობის შესწავლისას; ყველა წყვილური ურთიერთქმედების ყველა ძირითადი ეფექტისა და სამი ფაქტორის ყველა ურთიერთქმედების კონტროლის დროს; სამი ფაქტორის ინდივიდუალური ურთიერთქმედების შესწავლისას და ა.შ. ამ გზით გამოთვლილი ეფექტების კვადრატების ჯამები ეწოდება ტიპიIIკვადრატების ჯამი. Ისე, ტიპიIIკვადრატების ჯამი აკონტროლებს ერთი და იმავე რიგის ყველა ეფექტს და უფრო დაბალი, ხოლო იგნორირებას უკეთებს ყველა უმაღლესი რიგის ეფექტს.

კვადრატების ტიპის ჯამიIV. და ბოლოს, ზოგიერთი სპეციალური გეგმისთვის დაკარგული უჯრედებისთვის (არასრული გეგმები) შესაძლებელია გამოთვალოთ ე.წ. ტიპი IVკვადრატების ჯამი. ეს მეთოდი მოგვიანებით იქნება განხილული არასრული დიზაინის შესახებ (დიზაინი დაკარგული უჯრედებით).

I, II და III ტიპების კვადრატების ჯამის ჰიპოთეზის ინტერპრეტაცია

კვადრატების ჯამი ტიპიIIIყველაზე მარტივი ინტერპრეტაცია. შეგახსენებთ, რომ კვადრატების ჯამები ტიპიIIIშეამოწმეთ ეფექტები ყველა სხვა ეფექტის კონტროლის შემდეგ. მაგალითად, სტატისტიკურად მნიშვნელოვანი პოვნის შემდეგ ტიპიIIIეფექტი ფაქტორისთვის მოდულში დისპერსიის ანალიზი, შეგვიძლია ვთქვათ, რომ არსებობს ფაქტორის ერთი მნიშვნელოვანი ეფექტი , ყველა სხვა ეფექტის (ფაქტორების) დანერგვის შემდეგ და ამ ეფექტის შესაბამისად ინტერპრეტაცია. ყველა ANOVA აპლიკაციის ალბათ 99%-ში ეს არის ტესტის ტიპი, რომელიც მკვლევარს აინტერესებს. ამ ტიპის კვადრატების ჯამი ჩვეულებრივ გამოითვლება მოდულით დისპერსიის ანალიზინაგულისხმევად, მიუხედავად იმისა, არჩეულია თუ არა ეს ვარიანტი რეგრესიული მიდგომათუ არა (მოდულში მიღებული სტანდარტული მიდგომები დისპერსიის ანალიზიგანხილულია ქვემოთ).

კვადრატების ჯამების გამოყენებით მიღებული მნიშვნელოვანი ეფექტები ტიპიან ტიპიIIკვადრატების ჯამები არც ისე ადვილია ინტერპრეტაცია. ისინი საუკეთესოდ არის განმარტებული ეტაპობრივი მრავალვარიანტული რეგრესიის კონტექსტში. თუ კვადრატების ჯამის გამოყენებისას ტიპიმე B ფაქტორის ძირითადი ეფექტი იყო მნიშვნელოვანი (მას შემდეგ, რაც A ფაქტორი მოდელში შევიდა, მაგრამ სანამ A და B ურთიერთქმედება დაემატა), შეგვიძლია დავასკვნათ, რომ არსებობს B ფაქტორის მნიშვნელოვანი ძირითადი ეფექტი, იმ პირობით, რომ არ იქნება ურთიერთქმედება. A და B ფაქტორებს შორის (კრიტერიუმის გამოყენების შემთხვევაში ტიპიIII B ფაქტორი ასევე მნიშვნელოვანი აღმოჩნდა, მაშინ შეგვიძლია დავასკვნათ, რომ არსებობს B ფაქტორის მნიშვნელოვანი ძირითადი ეფექტი, ყველა სხვა ფაქტორის და მათი ურთიერთქმედების მოდელში შეყვანის შემდეგ).

ზღვრული ნიშნავს ჰიპოთეზას ტიპიმედა ტიპიIIჩვეულებრივ არ აქვთ მარტივი ინტერპრეტაცია. ამ შემთხვევებში ნათქვამია, რომ არ შეიძლება ეფექტების მნიშვნელობის ინტერპრეტაცია მხოლოდ ზღვრული საშუალებების გამოყენებით. უფრო მეტად წარმოდგენილი გვსაშუალებები დაკავშირებულია რთულ ჰიპოთეზასთან, რომელიც აერთიანებს საშუალებებს და ნიმუშის ზომას. Მაგალითად, ტიპიII A ფაქტორის ჰიპოთეზები ადრე განხილული 2 x 2 დიზაინის მარტივ მაგალითში იქნება (იხ. Woodward, Bonett, and Brecht, 1990, გვ. 219):

ნიჟ- საკანში დაკვირვების რაოდენობა

uij- საშუალო მნიშვნელობა უჯრედში

. - ზღვრული საშუალო

დეტალების გარეშე (დაწვრილებით იხილეთ Milliken and Johnson, 1984, თავი 10), ცხადია, რომ ეს არ არის მარტივი ჰიპოთეზები და უმეტეს შემთხვევაში არცერთი მათგანი არ არის განსაკუთრებული ინტერესი მკვლევარისთვის. თუმცა არის შემთხვევები, როდესაც ჰიპოთეზები ტიპიმეშეიძლება იყოს საინტერესო.

ნაგულისხმევი გამოთვლითი მიდგომა მოდულში დისპერსიის ანალიზი

ნაგულისხმევი, თუ ვარიანტი არ არის მონიშნული რეგრესიული მიდგომა, მოდული დისპერსიის ანალიზიიყენებს უჯრედის საშუალო მოდელი. ამ მოდელის მახასიათებელია ის, რომ სხვადასხვა ეფექტისთვის კვადრატების ჯამები გამოითვლება უჯრედის საშუალებების ხაზოვანი კომბინაციებისთვის. სრულ ფაქტორულ ექსპერიმენტში, ეს იწვევს კვადრატების ჯამებს, რომლებიც იგივეა, რაც ადრე განხილული კვადრატების ჯამები ტიპი III. თუმცა, ვარიანტში დაგეგმილი შედარება(ფანჯარაში ANOVA შედეგები), მომხმარებელს შეუძლია გამოსცადოს ჰიპოთეზა შეწონილი ან დაუწონავი უჯრედის საშუალებების ნებისმიერი წრფივი კომბინაციის წინააღმდეგ. ამრიგად, მომხმარებელს შეუძლია შეამოწმოს არა მხოლოდ ჰიპოთეზები ტიპიIII, მაგრამ ნებისმიერი ტიპის ჰიპოთეზა (მათ შორის ტიპიIV). ეს ზოგადი მიდგომა განსაკუთრებით სასარგებლოა გამოტოვებული უჯრედების მქონე დიზაინების შესწავლისას (ე.წ. არასრული დიზაინი).

სრული ფაქტორული დიზაინისთვის, ეს მიდგომა ასევე სასარგებლოა, როდესაც ადამიანს სურს შეწონილი ზღვრული საშუალებების ანალიზი. მაგალითად, დავუშვათ, რომ ადრე განხილულ მარტივ 2 x 2 დიზაინში, ჩვენ უნდა შევადაროთ შეწონილი (ფაქტორების დონეების მიხედვით ) ზღვრული ნიშნავს A ფაქტორისთვის. ეს გამოსადეგია, როდესაც დაკვირვებების განაწილება უჯრედებს შორის არ იყო მომზადებული ექსპერიმენტატორის მიერ, არამედ იყო აგებული შემთხვევით, და ეს შემთხვევითობა აისახება დაკვირვებების რაოდენობის განაწილებაში B ფაქტორის დონეზე. აგრეგატი.

მაგალითად, არის ფაქტორი - ქვრივების ასაკი. რესპონდენტთა შესაძლო ნიმუში იყოფა ორ ჯგუფად: 40 წლამდე და 40-ზე მეტი (ფაქტორი B). მეორე ფაქტორი (ფაქტორი A) გეგმის იყო იყო თუ არა ქვრივები სოციალური მხარდაჭერა ზოგიერთი სააგენტოსგან (ზოგიერთი ქვრივი შერჩეული იქნა შემთხვევით, სხვები ემსახურებოდნენ კონტროლს). ამ შემთხვევაში, ქვრივების განაწილება ასაკის მიხედვით ნიმუშში ასახავს ქვრივების რეალურ განაწილებას ასაკის მიხედვით პოპულაციაში. ქვრივების სოციალური მხარდაჭერის ჯგუფის ეფექტურობის შეფასება ყველა ასაკისშეესატყვისება საშუალო შეწონილს ორი ასაკობრივი ჯგუფისთვის (ჯგუფში დაკვირვების რაოდენობის შესაბამისი წონებით).

დაგეგმილი შედარება

გაითვალისწინეთ, რომ შეყვანილი კონტრასტის კოეფიციენტების ჯამი სულაც არ არის 0-ის (ნულის) ტოლი. ამის ნაცვლად, პროგრამა ავტომატურად განახორციელებს კორექტირებას, რათა უზრუნველყოს, რომ შესაბამისი ჰიპოთეზები არ იყოს აღრეული საერთო საშუალოსთან.

ამის საილუსტრაციოდ, მოდით დავუბრუნდეთ ადრე განხილულ მარტივ 2 x 2 გეგმას. შეგახსენებთ, რომ ამ გაუწონასწორებელი დიზაინის უჯრედებში დაკვირვებების რაოდენობაა -1, 2, 3 და 1. დავუშვათ, რომ გვინდა შევადაროთ A ფაქტორის შეწონილი ზღვრული საშუალებები (შეწონილი B ფაქტორის დონეების სიხშირით). შეგიძლიათ შეიყვანოთ კონტრასტის კოეფიციენტები:

გაითვალისწინეთ, რომ ეს კოეფიციენტები არ ემატება 0-ს. პროგრამა დააყენებს კოეფიციენტებს ისე, რომ ისინი დაემატება 0-მდე და მათი შედარებითი მნიშვნელობები შენარჩუნდება, ე.ი.

1/3 2/3 -3/4 -1/4

ეს კონტრასტები შეადარებს შეწონილ საშუალებებს ფაქტორ A-სთვის.

ჰიპოთეზები ძირითადი საშუალოზე.ჰიპოთეზა, რომ დაუწონავი ძირითადი საშუალო არის 0, შეიძლება გამოვიკვლიოთ კოეფიციენტების გამოყენებით:

ჰიპოთეზა, რომ შეწონილი ძირითადი საშუალო არის 0, შემოწმებულია გამოყენებით:

პროგრამა არავითარ შემთხვევაში არ არეგულირებს კონტრასტის კოეფიციენტებს.

გეგმების ანალიზი დაკარგული უჯრედებით (არასრული გეგმები)

ფაქტორულ დიზაინებს, რომლებიც შეიცავს ცარიელ უჯრედებს (უჯრედების კომბინაციების დამუშავება, რომლებსაც არ აქვთ დაკვირვება) ეწოდება არასრული. ასეთ დიზაინში, ზოგიერთი ფაქტორი, როგორც წესი, არ არის ორთოგონალური და ზოგიერთი ურთიერთქმედების გამოთვლა შეუძლებელია. ზოგადად, არ არსებობს უკეთესი მეთოდი ასეთი გეგმების გასაანალიზებლად.

რეგრესიული მიდგომა

ზოგიერთ ძველ პროგრამაში, რომლებიც ეყრდნობა ANOVA დიზაინის ანალიზს მრავალვარიანტული რეგრესიის გამოყენებით, არასრული დიზაინის ფაქტორები მითითებულია ნაგულისხმევად, როგორც ყოველთვის (თითქოს დიზაინი დასრულებულია). მულტივარიანტული რეგრესიის ანალიზები შემდეგ შესრულებულია ამ მოჩვენებით კოდირებულ ფაქტორებზე. სამწუხაროდ, ეს მეთოდი იძლევა შედეგებს, რომელთა ინტერპრეტაცია ძალიან რთულია, თუ არა შეუძლებელი, რადგან გაუგებარია, როგორ უწყობს ხელს თითოეული ეფექტი საშუალებების ხაზოვან კომბინაციას. განვიხილოთ შემდეგი მარტივი მაგალითი.

ფაქტორი ა ფაქტორი B
B1 B2
A1 3 4, 5
A2 6, 6, 7 გაუშვა

თუ შევასრულებთ ფორმის მრავალვარიანტულ რეგრესიას დამოკიდებული ცვლადი = მუდმივი + ფაქტორი A + ფაქტორი B, მაშინ ჰიპოთეზა A და B ფაქტორების მნიშვნელობის შესახებ საშუალებების ხაზოვანი კომბინაციების თვალსაზრისით ასე გამოიყურება:

ფაქტორი A: უჯრედი A1,B1 = უჯრედი A2,B1

ფაქტორი B: უჯრედი A1,B1 = უჯრედი A1,B2

ეს საქმე მარტივია. უფრო რთულ დიზაინებში შეუძლებელია იმის დადგენა, თუ კონკრეტულად რა იქნება გამოკვლეული.

უჯრედი ნიშნავს, ANOVA მიდგომა , IV ტიპის ჰიპოთეზები

მიდგომა, რომელიც რეკომენდირებულია ლიტერატურაში და რომელიც სასურველია, არის მნიშვნელოვანი შესწავლა (კვლევის კითხვების თვალსაზრისით) აპრიორიჰიპოთეზები გეგმის უჯრედებში დაფიქსირებული საშუალებების შესახებ. ამ მიდგომის დეტალური განხილვა შეგიძლიათ იხილოთ Dodge (1985), Heiberger (1989), Milliken and Johnson (1984), Searle (1987) ან Woodward, Bonett, and Brecht (1990). კვადრატების ჯამები, რომლებიც დაკავშირებულია ჰიპოთეზებთან საშუალებების წრფივი კომბინაციის შესახებ არასრულ კონსტრუქციებში, რომლებიც იკვლევენ ეფექტების ნაწილის შეფასებას, ასევე უწოდებენ კვადრატების ჯამს. IV.

ტიპის ჰიპოთეზების ავტომატური წარმოქმნაIV. როდესაც მრავალვარიანტულ დიზაინს აქვს უჯრედების კომპლექსური დაკარგული შაბლონები, სასურველია განისაზღვროს ორთოგონალური (დამოუკიდებელი) ჰიპოთეზები, რომელთა შესწავლა ექვივალენტურია ძირითადი ეფექტების ან ურთიერთქმედებების შესწავლის. ალგორითმული (გამოთვლითი) სტრატეგიები (დაფუძნებული ფსევდო-ინვერსიული დიზაინის მატრიცაზე) შემუშავებულია ასეთი შედარებისთვის შესაფერისი წონების შესაქმნელად. სამწუხაროდ, საბოლოო ჰიპოთეზები არ არის განსაზღვრული უნიკალური გზით. რა თქმა უნდა, ისინი დამოკიდებულნი არიან ეფექტების გამოვლენის თანმიმდევრობაზე და იშვიათად იძლევა მარტივი ინტერპრეტაციის საშუალებას. ამიტომ რეკომენდებულია დაკარგული უჯრედების ბუნების გულდასმით შესწავლა, შემდეგ ჰიპოთეზების ჩამოყალიბება ტიპიIV, რომლებიც ყველაზე მნიშვნელოვნად შეესაბამება კვლევის მიზნებს. შემდეგ გამოიკვლიეთ ეს ჰიპოთეზები ოფციის გამოყენებით დაგეგმილი შედარებაფანჯარაში შედეგები. ამ შემთხვევაში შედარებების დაზუსტების უმარტივესი გზაა ყველა ფაქტორისთვის კონტრასტების ვექტორის დანერგვის მოთხოვნა. ერთადფანჯარაში დაგეგმილი შედარება.დიალოგური ფანჯრის დარეკვის შემდეგ დაგეგმილი შედარებანაჩვენები იქნება ყველა ჯგუფი მიმდინარე გეგმაში და მონიშნული იქნება ის, რაც აკლია.

დაკარგული უჯრედები და ტესტირება კონკრეტული ეფექტისთვის

არსებობს რამდენიმე ტიპის დიზაინი, რომლებშიც დაკარგული უჯრედების მდებარეობა შემთხვევითი არ არის, მაგრამ საგულდაგულოდ არის დაგეგმილი, რაც იძლევა ძირითადი ეფექტების მარტივ ანალიზს სხვა ეფექტებზე გავლენის გარეშე. მაგალითად, როდესაც გეგმაში უჯრედების საჭირო რაოდენობა არ არის ხელმისაწვდომი, გეგმები ხშირად გამოიყენება ლათინური კვადრატებირამდენიმე ფაქტორის ძირითადი ეფექტის შეფასება დონეების დიდი რაოდენობით. მაგალითად, 4 x 4 x 4 x 4 ფაქტორული დიზაინი მოითხოვს 256 უჯრედს. ამავე დროს შეგიძლიათ გამოიყენოთ ბერძნულ-ლათინური მოედანიძირითადი ეფექტების შეფასება დიზაინში მხოლოდ 16 უჯრედით (თავი ექსპერიმენტის დაგეგმვა, ტომი IV, შეიცავს ასეთი გეგმების დეტალურ აღწერას). არასრული დიზაინი, რომელშიც ძირითადი ეფექტები (და ზოგიერთი ურთიერთქმედება) შეიძლება შეფასდეს საშუალებების მარტივი ხაზოვანი კომბინაციების გამოყენებით, ე.წ. დაბალანსებული არასრული გეგმები.

დაბალანსებულ დიზაინებში, ძირითადი ეფექტებისა და ურთიერთქმედებისთვის კონტრასტების (წონის) გენერირების სტანდარტული (ნაგულისხმევი) მეთოდი წარმოქმნის დისპერსიების ანალიზის ცხრილს, რომელშიც შესაბამისი ეფექტების კვადრატების ჯამები არ არის ერთმანეთში აღრეული. ვარიანტი სპეციფიკური ეფექტებიფანჯარა შედეგებიგამოიმუშავებს გამოტოვებულ კონტრასტებს გეგმის გამოტოვებულ უჯრედებზე ნულის ჩაწერით. ვარიანტის მოთხოვნისთანავე სპეციფიკური ეფექტებიმომხმარებლისთვის, რომელიც განიხილავს ზოგიერთ ჰიპოთეზას, ჩნდება შედეგების ცხრილი რეალური წონებით. გაითვალისწინეთ, რომ დაბალანსებულ დიზაინში, შესაბამისი ეფექტების კვადრატების ჯამები გამოითვლება მხოლოდ იმ შემთხვევაში, თუ ეს ეფექტები ორთოგონალურია (დამოუკიდებელი) ყველა სხვა ძირითადი ეფექტისა და ურთიერთქმედების მიმართ. წინააღმდეგ შემთხვევაში, თქვენ უნდა გამოიყენოთ ეს ვარიანტი დაგეგმილი შედარებასაშუალებებს შორის მნიშვნელოვანი შედარებების შესასწავლად.

უჯრედები აკლია და გაერთიანებული ეფექტები/შეცდომის ტერმინები

თუ ვარიანტი რეგრესიული მიდგომამოდულის დაწყების პანელში დისპერსიის ანალიზიარ არის არჩეული, უჯრედის საშუალო მოდელი გამოყენებული იქნება ეფექტებისთვის კვადრატების ჯამის გამოთვლისას (ნაგულისხმევი პარამეტრი). თუ დიზაინი არ არის დაბალანსებული, მაშინ არაორთოგონალური ეფექტების კომბინირებისას (იხ. ვარიანტის ზემოთ განხილვა გამოტოვებული უჯრედები და სპეციფიკური ეფექტი) შეიძლება მივიღოთ კვადრატების ჯამი, რომელიც შედგება არაორთოგონალური (ან გადახურული) კომპონენტებისგან. მიღებული შედეგები, როგორც წესი, არ არის ინტერპრეტაცია. ამიტომ, ძალიან ფრთხილად უნდა იყოთ რთული არასრული ექსპერიმენტული დიზაინის შერჩევისა და განხორციელებისას.

ბევრი წიგნია, სადაც დეტალურად არის განხილული სხვადასხვა ტიპის გეგმები. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken and Johnson, 1984; Searle, 1987; Woodward and Bonett, 1990), მაგრამ ამ ტიპის ინფორმაცია სცილდება ამ სახელმძღვანელოს ფარგლებს. თუმცა, ამ სექციაში მოგვიანებით იქნება ნაჩვენები სხვადასხვა ტიპის გეგმების ანალიზი.

ვარაუდები და ვარაუდების დარღვევის შედეგები

გადახრა ნორმალური განაწილების დაშვებიდან

დავუშვათ, დამოკიდებული ცვლადი იზომება რიცხვითი მასშტაბით. მოდით ასევე დავუშვათ, რომ დამოკიდებული ცვლადი ჩვეულებრივ ნაწილდება თითოეულ ჯგუფში. დისპერსიის ანალიზიშეიცავს გრაფიკებისა და სტატისტიკის ფართო სპექტრს ამ ვარაუდის გასამყარებლად.

შეფერხების ეფექტები.Საერთოდ ტესტი ძალიან მდგრადია ნორმალურობიდან გადახრების მიმართ (დაწვრილებითი შედეგებისთვის იხილეთ Lindman, 1974). თუ ქურთოზი 0-ზე მეტია, მაშინ სტატისტიკის მნიშვნელობა არის შეიძლება გახდეს ძალიან პატარა. ნულოვანი ჰიპოთეზა მიღებულია, თუმცა შეიძლება სიმართლე არ იყოს. სიტუაცია საპირისპიროა, როდესაც ქურთოზი 0-ზე ნაკლებია. განაწილების დახრილობა ჩვეულებრივ მცირე გავლენას ახდენს მასზე სტატისტიკა. თუ უჯრედში დაკვირვებების რაოდენობა საკმარისად დიდია, მაშინ ნორმალურობიდან გადახრა განსაკუთრებით მნიშვნელოვანი არ არის იმის გამო, რომ ცენტრალური ლიმიტის თეორემა, რომლის მიხედვითაც საშუალო მნიშვნელობის განაწილება მიახლოებულია ნორმასთან, საწყისი განაწილების მიუხედავად. მდგრადობის დეტალური განხილვა სტატისტიკა შეგიძლიათ იხილოთ ბოქს და ანდერსონში (1955), ან ლინდმანში (1974).

დისპერსიის ერთგვაროვნება

ვარაუდები.ვარაუდობენ, რომ სხვადასხვა დიზაინის ჯგუფების განსხვავებები იგივეა. ამ ვარაუდს ეწოდება ვარაუდი დისპერსიის ჰომოგენურობა.შეგახსენებთ, რომ ამ განყოფილების დასაწყისში, კვადრატული შეცდომების ჯამის გამოთვლისას, ჩვენ ვასრულებდით შეჯამებას თითოეულ ჯგუფში. თუ დისპერსიები ორ ჯგუფში განსხვავდება ერთმანეთისგან, მაშინ მათი შეკრება არც თუ ისე ბუნებრივია და არ იძლევა მთლიანი ჯგუფური დისპერსიის შეფასებას (რადგან ამ შემთხვევაში საერთოდ არ არსებობს მთლიანი ვარიაცია). მოდული დისპერსიის ანალიზი -ANOVA/მანოვაშეიცავს სტატისტიკური კრიტერიუმების დიდ კრებულს დისპერსიის ჰომოგენურობის დაშვებებიდან გადახრების გამოსავლენად.

შეფერხების ეფექტები.ლინდმანი (1974, გვ. 33) აჩვენებს, რომ კრიტერიუმი საკმაოდ სტაბილურია დისპერსიის ჰომოგენურობის დაშვების დარღვევის მიმართ ( ჰეტეროგენულობასხვაობა, აგრეთვე Box, 1954a, 1954b; ჰსუ, 1938).

განსაკუთრებული შემთხვევა: საშუალებებისა და დისპერსიების კორელაცია.არის შემთხვევები, როცა სტატისტიკას შეუძლია შეცდომაში შეყვანა.ეს ხდება მაშინ, როდესაც დიზაინის უჯრედების საშუალებები კორელაციაშია განსხვავებასთან. მოდული დისპერსიის ანალიზისაშუალებას გაძლევთ დახაზოთ დისპერსიის ან სტანდარტული გადახრის სკატერული ნახაზები საშუალოზე, რათა აღმოაჩინოს ასეთი კორელაცია. მიზეზი, რის გამოც ეს კორელაცია საშიშია, შემდეგია. წარმოვიდგინოთ, რომ გეგმაში არის 8 უჯრედი, რომელთაგან 7-ს აქვს თითქმის იგივე საშუალო, ხოლო ერთ უჯრედში საშუალო გაცილებით მაღალია, ვიდრე სხვები. მერე ტესტმა შეიძლება გამოავლინოს სტატისტიკურად მნიშვნელოვანი ეფექტი. მაგრამ დავუშვათ, რომ დიდი საშუალო მნიშვნელობის მქონე უჯრედში დისპერსია მნიშვნელოვნად აღემატება სხვებს, ე.ი. უჯრედებში საშუალო მნიშვნელობა და დისპერსია დამოკიდებულია (რაც უფრო მაღალია საშუალო, მით მეტია ვარიაცია). ამ შემთხვევაში, დიდი საშუალო არასანდოა, რადგან ის შეიძლება გამოწვეული იყოს მონაცემთა დიდი დისპერსიით. თუმცა სტატისტიკაზე დაყრდნობით გაერთიანებულიდისპერსიას უჯრედებში დაიჭერს გრანდიოზულ საშუალოს, თუმცა ტესტები, რომლებიც დაფუძნებულია დისპერსიაზე თითოეულ უჯრედში, არ განიხილავს ყველა განსხვავებას საშუალოდ მნიშვნელოვანად.

ამ ტიპის მონაცემები (დიდი საშუალო და დიდი დისპერსია) ხშირად ჩნდება, როდესაც არსებობს გარე დაკვირვებები. ერთი ან ორი გამოკვეთილი დაკვირვება მნიშვნელოვნად ცვლის საშუალოს და მნიშვნელოვნად ზრდის დისპერსიას.

ვარიანტებისა და კოვარიანტების ჰომოგენურობა

ვარაუდები.მრავალვარიანტული კონსტრუქციები მრავალვარიანტებზე დამოკიდებული ზომებით ასევე იყენებენ ვარაუდს დისპერსიის ჰომოგენურობის შესახებ, რომელიც აღწერილია ადრე. თუმცა, ვინაიდან არსებობს მრავალვარიანტული დამოკიდებული ცვლადები, ასევე საჭიროა, რომ მათი ურთიერთკორელაციები (კოვარიანტები) იყოს ერთგვაროვანი დიზაინის ყველა უჯრედში. მოდული დისპერსიის ანალიზიგთავაზობთ ამ ვარაუდების შესამოწმებლად სხვადასხვა გზებს.

შეფერხების ეფექტები. მრავალგანზომილებიანი ანალოგი - კრიტერიუმი - Wilks' λ-ტესტი. ბევრი რამ არ არის ცნობილი Wilks λ ტესტის გამძლეობის შესახებ ზემოაღნიშნული ვარაუდების დარღვევებთან მიმართებაში. თუმცა, მოდულის შედეგების ინტერპრეტაციის შემდეგ დისპერსიის ანალიზიჩვეულებრივ ეფუძნება ცალცვლადი ეფექტების მნიშვნელობას (ზოგადი კრიტერიუმის მნიშვნელოვნების დადგენის შემდეგ), გამძლეობის განხილვა ძირითადად ეხება დისპერსიის ერთვარიანტულ ანალიზს. ამიტომ, ცალმხრივი ეფექტების მნიშვნელობა გულდასმით უნდა იქნას შესწავლილი.

განსაკუთრებული შემთხვევა: კოვარიანტობის ანალიზი.დისპერსიული/კოვარიანტული ჰომოგენურობის განსაკუთრებით მძიმე დარღვევები შეიძლება მოხდეს, როდესაც კოვარიატები შედის დიზაინში. კერძოდ, თუ კორელაცია კოვარიატებსა და დამოკიდებულ ზომებს შორის განსხვავდება დიზაინის უჯრედებში, შეიძლება მოხდეს შედეგების არასწორი ინტერპრეტაცია. გახსოვდეთ, რომ კოვარიანტობის ანალიზი არსებითად ახორციელებს რეგრესიის ანალიზს თითოეულ უჯრედში, რათა გამოყოს დისპერსიის ის ნაწილი, რომელიც აღირიცხება კოვარიატში. ვარიაციის/კოვარიანტობის ჰომოგენურობის ვარაუდი ვარაუდობს, რომ ეს რეგრესიის ანალიზი ტარდება შემდეგი შეზღუდვის ქვეშ: ყველა უჯრედის რეგრესიული განტოლება (დახრილობა) ერთნაირია. თუ ეს არ არის გათვალისწინებული, მაშინ შეიძლება დიდი შეცდომები გამოჩნდეს. მოდული დისპერსიის ანალიზიაქვს რამდენიმე სპეციალური კრიტერიუმი ამ ვარაუდის შესამოწმებლად. მიზანშეწონილია გამოიყენოთ ეს კრიტერიუმები იმის უზრუნველსაყოფად, რომ სხვადასხვა უჯრედების რეგრესიის განტოლებები დაახლოებით იგივეა.

სფერულობა და რთული სიმეტრია: განმეორებითი ზომების მრავალვარიანტული მიდგომის გამოყენების მიზეზები დისპერსიის ანალიზში

დიზაინებში, რომლებიც შეიცავს ორზე მეტი დონის განმეორებით გაზომვის ფაქტორებს, ერთვარიანტული ANOVA-ს გამოყენება მოითხოვს დამატებით დაშვებებს: ნაერთის სიმეტრიის დაშვება და სფერულობის ვარაუდი. ეს ვარაუდები იშვიათად სრულდება (იხ. ქვემოთ). ამიტომ, ბოლო წლებში, დისპერსიის მრავალვარიანტულმა ანალიზმა მოიპოვა პოპულარობა ასეთ დიზაინებში (ორივე მიდგომა გაერთიანებულია მოდულში დისპერსიის ანალიზი).

რთული სიმეტრიის დაშვებანაერთის სიმეტრიის დაშვება არის ის, რომ დისპერსიები (გაზიარებული ჯგუფებში) და კოვარიანსები (ჯგუფებში გაზიარებული) სხვადასხვა განმეორებითი ზომებისთვის ერთგვაროვანია (იგივე). ეს არის საკმარისი პირობა იმისთვის, რომ ცალმხრივი F ტესტი იყოს განმეორებითი ზომებისთვის (ანუ, მოხსენებული F მნიშვნელობები საშუალოდ შეესაბამება F განაწილებას). თუმცა, ამ შემთხვევაში ეს პირობა არ არის აუცილებელი.

სფერულობის დაშვება.სფერულობის დაშვება აუცილებელი და საკმარისი პირობაა, რომ F-ტესტი იყოს მართებული. ის მდგომარეობს იმაში, რომ ჯგუფებში ყველა დაკვირვება დამოუკიდებელი და თანაბრად ნაწილდება. ამ ვარაუდების ბუნება და მათი დარღვევის გავლენა, როგორც წესი, კარგად არ არის აღწერილი ANOVA-ს წიგნებში - ეს განხილული იქნება შემდეგ აბზაცებში. ასევე ნაჩვენები იქნება, რომ ერთვარიანტული მიდგომის შედეგები შეიძლება განსხვავდებოდეს მულტივარიანტული მიდგომის შედეგებისგან და აგიხსნით რას ნიშნავს ეს.

ჰიპოთეზების დამოუკიდებლობის საჭიროება. ANOVA-ში მონაცემების ანალიზის ზოგადი გზაა მოდელის მორგება. თუ მოდელთან შედარებით, რომელიც შეესაბამება მონაცემებს, არსებობს რამდენიმე აპრიორიჰიპოთეზები, შემდეგ ვარიაცია იყოფა ამ ჰიპოთეზების შესამოწმებლად (ძირითადი ეფექტების, ურთიერთქმედებების კრიტერიუმები). გამოთვლითი თვალსაზრისით, ეს მიდგომა წარმოშობს კონტრასტების ერთობლიობას (გეგმის საშუალებების შედარებების ერთობლიობა). თუმცა, თუ კონტრასტები ერთმანეთისგან დამოუკიდებელი არ არის, დისპერსიების დაყოფა უაზრო ხდება. მაგალითად, თუ ორი კონტრასტია და იდენტურია და დისპერსიის შესაბამისი ნაწილი ამოღებულია, შემდეგ ერთი და იგივე ნაწილი ამოღებულია ორჯერ. მაგალითად, სულელური და უაზროა ორი ჰიპოთეზის იდენტიფიცირება: „უჯრედ 1-ში საშუალო უფრო მაღალია, ვიდრე მე-2 უჯრედის საშუალო“ და „საშუალო უჯრედი 1-ში უფრო მაღალია, ვიდრე საშუალო უჯრედი 2-ში“. ასე რომ, ჰიპოთეზები უნდა იყოს დამოუკიდებელი ან ორთოგონალური.

დამოუკიდებელი ჰიპოთეზები განმეორებით ზომებში.მოდულში განხორციელებული ზოგადი ალგორითმი დისპერსიის ანალიზი, შეეცდება დამოუკიდებელი (ორთოგონალური) კონტრასტების გენერირებას თითოეული ეფექტისთვის. განმეორებითი ზომების ფაქტორისთვის, ეს კონტრასტები იძლევა ბევრ ჰიპოთეზას განსხვავებებიგანსახილველი ფაქტორის დონეებს შორის. თუმცა, თუ ეს განსხვავებები კორელაციაშია ჯგუფებში, მაშინ მიღებული კონტრასტები აღარ არის დამოუკიდებელი. მაგალითად, სწავლებისას, სადაც სტუდენტები ერთ სემესტრში სამჯერ იზომება, შეიძლება მოხდეს, რომ პირველ და მე-2 გაზომვას შორის ცვლილება უარყოფითად იყოს დაკავშირებული საგნების მე-2 და მე-3 გაზომვის ცვლილებასთან. ისინი, ვინც აითვისეს მასალის უმეტესი ნაწილი 1-ლი და მე-2 განზომილებებს შორის, ითვისებენ უფრო მცირე ნაწილს მე-2 და მე-3 განზომილებებს შორის გავლილი დროის განმავლობაში. ფაქტობრივად, უმეტეს შემთხვევაში, როდესაც ANOVA გამოიყენება განმეორებითი ზომებისთვის, დონეების მიხედვით ცვლილებები შეიძლება ჩაითვალოს, რომ დაკავშირებულია სუბიექტებს შორის. თუმცა, როდესაც ეს მოხდება, რთული სიმეტრიის დაშვება და სფერულობის ვარაუდი არ მოქმედებს და დამოუკიდებელი კონტრასტების გამოთვლა შეუძლებელია.

დარღვევების გავლენა და მათი გამოსწორების გზები.როდესაც რთული სიმეტრიის ან სფერულობის დაშვებები არ არის დაკმაყოფილებული, ANOVA-მ შეიძლება გამოიწვიოს მცდარი შედეგები. სანამ მრავალვარიანტული პროცედურები საკმარისად განვითარდებოდა, რამდენიმე ვარაუდი იყო შემოთავაზებული ამ ვარაუდების დარღვევის კომპენსაციის მიზნით. (იხილეთ, მაგალითად, Greenhouse & Geisser, 1959 და Huynh & Feldt, 1970). ეს მეთოდები ჯერ კიდევ ფართოდ გამოიყენება (ამიტომაც არის წარმოდგენილი მოდულში დისპერსიის ანალიზი).

მრავალვარიანტული ანალიზის დისპერსიული მიდგომა განმეორებით ღონისძიებებზე.ზოგადად, რთული სიმეტრიისა და სფერულობის პრობლემები ეხება იმ ფაქტს, რომ განმეორებითი ზომების ფაქტორების ეფექტების შესწავლაში შემავალი კონტრასტების კომპლექტები (2 დონეზე მეტი) არ არის ერთმანეთისგან დამოუკიდებელი. თუმცა, მათი გამოყენებისას დამოუკიდებლობა არ არის საჭირო მრავალგანზომილებიანიტესტი ორი ან მეტი განმეორებითი ზომის ფაქტორების კონტრასტების სტატისტიკური მნიშვნელოვნების ერთდროულად შესამოწმებლად. ეს არის მიზეზი იმისა, რომ დისპერსიის მრავალვარიანტული ანალიზის ტექნიკა სულ უფრო ხშირად გამოიყენება ცალმხრივი განმეორებითი ზომების ფაქტორების მნიშვნელობის შესამოწმებლად 2 დონეზე მეტი. ეს მიდგომა ფართოდ არის მიღებული, რადგან ის ზოგადად არ საჭიროებს რთულ სიმეტრიას ან სფერულობას.

შემთხვევები, რომლებშიც დისპერსიის მრავალვარიანტული ანალიზის მიდგომის გამოყენება შეუძლებელია.არის მაგალითები (დიზაინი), სადაც დისპერსიის მრავალვარიანტული ანალიზის მიდგომის გამოყენება შეუძლებელია. ეს არის, როგორც წესი, შემთხვევები, როდესაც არის მცირე რაოდენობის საგნები დიზაინში და მრავალი დონე განმეორებითი ზომების ფაქტორში. მაშინ შეიძლება იყოს ძალიან ცოტა დაკვირვება მრავალვარიანტული ანალიზის ჩასატარებლად. მაგალითად, თუ არის 12 საგანი, გვ = 4 განმეორებითი ზომების ფაქტორი და თითოეულ ფაქტორს აქვს = 3 დონეები. მაშინ 4 ფაქტორის ურთიერთქმედება "მოიხმარს" (-1)P = 2 4 = 16 თავისუფლების ხარისხები. თუმცა, არსებობს მხოლოდ 12 საგანი, ამიტომ ამ მაგალითში მრავალვარიანტული ტესტის ჩატარება შეუძლებელია. მოდული დისპერსიის ანალიზიდამოუკიდებლად აღმოაჩენს ამ დაკვირვებებს და გამოთვლის მხოლოდ ერთგანზომილებიან კრიტერიუმებს.

განსხვავებები ერთვარიანტულ და მრავალვარიანტულ შედეგებში.თუ კვლევა მოიცავს განმეორებით გაზომვების დიდ რაოდენობას, შეიძლება იყოს შემთხვევები, როდესაც ცალმხრივი განმეორებითი ზომების ANOVA მიდგომა იძლევა შედეგებს, რომლებიც ძალიან განსხვავდება მულტივარიანტული მიდგომით მიღებული შედეგებისგან. ეს ნიშნავს, რომ განსხვავებები შესაბამისი განმეორებითი ზომების დონეებს შორის კორელაციაშია სუბიექტებში. ზოგჯერ ეს ფაქტი გარკვეულ დამოუკიდებელ ინტერესს იწვევს.

დისპერსიის მრავალვარიანტული ანალიზი და სტრუქტურული განტოლების მოდელირება

ბოლო წლებში სტრუქტურული განტოლების მოდელირება პოპულარული გახდა, როგორც ვარიაციის მრავალვარიანტული ანალიზის ალტერნატივა (იხილეთ, მაგალითად, Bagozzi and Yi, 1989; Bagozzi, Yi, and Singh, 1991; Cole, Maxwell, Arvey, and Salas, 1993). . ეს მიდგომა საშუალებას იძლევა გამოიცადოს ჰიპოთეზები არა მხოლოდ სხვადასხვა ჯგუფებში საშუალებებზე, არამედ დამოკიდებული ცვლადების კორელაციური მატრიცების შესახებ. მაგალითად, შეიძლება დაისვენოს ვარიაციების და კოვარიანსების ჰომოგენურობის დაშვება და ცალსახად შეიტანოს შეცდომის ვარიაციები და კოვარიანსები მოდელში თითოეული ჯგუფისთვის. მოდული სტატისტიკასტრუქტურული განტოლების მოდელირება (SEPATH) (იხ. ტომი III) იძლევა ასეთი ანალიზის საშუალებას.

ამ შენიშვნაში სტატისტიკის გამოყენება ილუსტრირებული იქნება ჯვარედინი მაგალითით. ვთქვათ, თქვენ ხართ Perfect Parachute-ის წარმოების მენეჯერი. პარაშუტები დამზადებულია სინთეზური ბოჭკოებისგან, რომელსაც ოთხი სხვადასხვა მომწოდებელი აწვდის. პარაშუტის ერთ-ერთი მთავარი მახასიათებელი მისი სიძლიერეა. თქვენ უნდა დარწმუნდეთ, რომ მიწოდებული ყველა ბოჭკო არის იგივე სიმტკიცის. ამ კითხვაზე პასუხის გასაცემად, ექსპერიმენტული დიზაინი უნდა იყოს შემუშავებული სხვადასხვა მომწოდებლების სინთეზური ბოჭკოებისგან ნაქსოვი პარაშუტების სიძლიერის გასაზომად. ამ ექსპერიმენტიდან მიღებული ინფორმაცია განსაზღვრავს, თუ რომელი მიმწოდებელი აწვდის ყველაზე გამძლე პარაშუტებს.

ბევრი აპლიკაცია მოიცავს ექსპერიმენტებს, რომლებიც ითვალისწინებენ ერთი ფაქტორის მრავალ ჯგუფს ან დონეს. ზოგიერთ ფაქტორს, როგორიცაა კერამიკული სროლის ტემპერატურა, შეიძლება ჰქონდეს რამდენიმე რიცხვითი დონე (ანუ 300°, 350°, 400° და 450°). სხვა ფაქტორებს, როგორიცაა საქონლის მდებარეობა სუპერმარკეტში, შეიძლება ჰქონდეს კატეგორიული დონე (მაგ., პირველი მიმწოდებელი, მეორე მიმწოდებელი, მესამე მიმწოდებელი, მეოთხე მიმწოდებელი). ერთფაქტორიან ექსპერიმენტებს, რომლებშიც ექსპერიმენტული ერთეულები შემთხვევით ნაწილდება ჯგუფებად ან ფაქტორების დონეზე, ეწოდება სრულიად რანდომიზებული.

გამოყენება- კრიტერიუმები რამდენიმე მათემატიკური მოლოდინის განსხვავების შესაფასებლად

თუ ჯგუფებში ფაქტორის რიცხვითი გაზომვები უწყვეტია და დაკმაყოფილებულია რამდენიმე დამატებითი პირობა, დისპერსიის ანალიზი (ANOVA) გამოიყენება რამდენიმე ჯგუფის მათემატიკური მოლოდინების შესადარებლად. ანანალიზი ვარაანსი). დისპერსიის ანალიზს სრულიად რანდომიზებული დიზაინის გამოყენებით ეწოდება ცალმხრივი ANOVA პროცედურა. გარკვეულწილად, ცდომილების ანალიზის ტერმინი არასწორია, რადგან ის ადარებს განსხვავებებს ჯგუფების მოსალოდნელ მნიშვნელობებს შორის, ვიდრე დისპერსიებს შორის. თუმცა, მათემატიკური მოლოდინების შედარება ხდება ზუსტად მონაცემთა ცვალებადობის ანალიზის საფუძველზე. ANOVA პროცედურაში, გაზომვის შედეგების მთლიანი ცვალებადობა იყოფა ჯგუფებს შორის და შიდა ჯგუფებად (ნახ. 1). ჯგუფში ცვალებადობა აიხსნება ექსპერიმენტული შეცდომით, ხოლო ჯგუფს შორის ცვალებადობა აიხსნება ექსპერიმენტული პირობების ეფექტებით. სიმბოლო თანაღნიშნავს ჯგუფების რაოდენობას.

ბრინჯი. 1. დაყოფის ვარიაცია სრულიად რანდომიზებულ ექსპერიმენტში

ჩამოტვირთეთ შენიშვნა ფორმატში ან ფორმატში, მაგალითები ფორმატში

მოდი ვიჩვენოთ, რომ თანჯგუფები ამოღებულია დამოუკიდებელი პოპულაციებიდან, რომლებსაც აქვთ ნორმალური განაწილება და თანაბარი ვარიაცია. ნულოვანი ჰიპოთეზა არის ის, რომ პოპულაციების მათემატიკური მოლოდინები იგივეა: H 0: μ 1 = μ 2 = ... = μ s. ალტერნატიული ჰიპოთეზა ამბობს, რომ ყველა მათემატიკური მოლოდინი არ არის ერთნაირი: H 1: ყველა μ j არ არის ერთნაირი = 1, 2, ..., s).

ნახ. სურათი 2 წარმოადგენს ჭეშმარიტ ნულოვანი ჰიპოთეზას ხუთი შედარებული ჯგუფის მათემატიკური მოლოდინების შესახებ, იმ პირობით, რომ პოპულაციებს აქვთ ნორმალური განაწილება და იგივე ვარიაცია. ფაქტორის სხვადასხვა დონესთან დაკავშირებული ხუთი პოპულაცია იდენტურია. შესაბამისად, ისინი ერთმანეთზე არიან გადანაწილებული, აქვთ ერთი და იგივე მათემატიკური მოლოდინი, ცვალებადობა და ფორმა.

ბრინჯი. 2. ხუთ ზოგად პოპულაციას აქვს იგივე მათემატიკური მოლოდინი: μ 1 = μ 2 = μ 3 = μ 4 = μ 5

მეორეს მხრივ, დავუშვათ, რომ სინამდვილეში ნულოვანი ჰიპოთეზა მცდარია, მეოთხე დონეს აქვს ყველაზე მაღალი მოსალოდნელი მნიშვნელობა, პირველ დონეს აქვს ოდნავ დაბალი მოსალოდნელი მნიშვნელობა, ხოლო დანარჩენ დონეებს აქვთ იგივე და კიდევ უფრო დაბალი მოსალოდნელი მნიშვნელობები ( სურათი 3). გაითვალისწინეთ, რომ მოსალოდნელი მნიშვნელობების გარდა, ხუთივე პოპულაცია იდენტურია (ანუ აქვთ ერთი და იგივე ცვალებადობა და ფორმა).

ბრინჯი. 3. ექსპერიმენტული პირობების ეფექტი შეინიშნება: μ 4 > μ 1 > μ 2 = μ 3 = μ 5

რამდენიმე ზოგადი პოპულაციის მათემატიკური მოლოდინების თანასწორობის შესახებ ჰიპოთეზის შემოწმებისას, მთლიანი ცვალებადობა იყოფა ორ ნაწილად: ჯგუფთაშორისი ცვალებადობა, ჯგუფებს შორის განსხვავებების გამო და შიდაჯგუფური ვარიაცია, იმავე ჯგუფს მიკუთვნებულ ელემენტებს შორის განსხვავებების გამო. მთლიანი ცვალებადობა გამოიხატება კვადრატების ჯამური ჯამით (SST – კვადრატების ჯამი). მას შემდეგ, რაც ნულოვანი ჰიპოთეზა არის, რომ მათემატიკური მოლოდინი ყველა თანჯგუფები ერთმანეთის ტოლია, მთლიანი ცვალებადობა უდრის ცალკეულ დაკვირვებებსა და საერთო საშუალოს (საშუალოების საშუალო) ჯამის კვადრატული განსხვავებების ჯამს, რომელიც გამოითვლება ყველა ნიმუშისთვის. სრული ვარიაცია:

სად - საერთო საშუალო, X ij - მე-e დაკვირვება - ჯგუფი ან დონე, n j- დაკვირვებების რაოდენობა ე ჯგუფი, - დაკვირვებების საერთო რაოდენობა ყველა ჯგუფში (ე.ი. = 1 + n 2 + … + n გ), თან- შესწავლილი ჯგუფების ან დონეების რაოდენობა.

ცვალებადობა ჯგუფს შორის, რომელსაც ჩვეულებრივ უწოდებენ კვადრატთა შორის ჯგუფის ჯამს (SSA - კვადრატების ჯამი ჯგუფებს შორის), უდრის თითოეული ჯგუფის სანიმუშო საშუალოს შორის განსხვავებების კვადრატების ჯამს. და საერთო საშუალო , გამრავლებული შესაბამისი ჯგუფის მოცულობაზე n j:

სად თან- შესწავლილი ჯგუფების ან დონეების რაოდენობა, n j- დაკვირვებების რაოდენობა ე ჯგუფი, - საშუალო ღირებულება ე ჯგუფი, - საერთო საშუალო.

ცვალებადობა ჯგუფში, რომელსაც ჩვეულებრივ უწოდებენ კვადრატების შიდა ჯგუფის ჯამს (SSW - კვადრატების ჯამი ჯგუფებში), უდრის თითოეული ჯგუფის ელემენტებს შორის განსხვავებების კვადრატების ჯამს და ამ ჯგუფის საშუალო სანიმუშო მნიშვნელობას შორის. :

სად Xიჯ - მეე ელემენტი ე ჯგუფი, - საშუალო ღირებულება ე ჯგუფი.

ვინაიდან ისინი შედარებულია თანფაქტორების დონეები, კვადრატების ჯგუფთაშორისი ჯამი აქვს s – 1თავისუფლების ხარისხები. Თითოეული თანდონეები აქვს n j – 1 თავისუფლების ხარისხი, ასე რომ, კვადრატების შიდაჯგუფური ჯამი აქვს - თანთავისუფლების ხარისხი და

გარდა ამისა, კვადრატების ჯამური ჯამი აქვს – 1 თავისუფლების ხარისხი, ყოველი დაკვირვების შემდეგ Xიჯშედარებულია საერთო საშუალო გამოთვლილთან დაკვირვებები. თუ თითოეული ეს ჯამი იყოფა თავისუფლების ხარისხების შესაბამის რაოდენობაზე, წარმოიქმნება დისპერსიის სამი ტიპი: ჯგუფთაშორისი(საშუალო კვადრატი - MSA-ს შორის), შიდაჯგუფი(საშუალო კვადრატი ფარგლებში - MSW) და სავსე(საშუალო კვადრატი ჯამური - MST):

მიუხედავად იმისა, რომ დისპერსიის ანალიზის მთავარი მიზანია მათემატიკური მოლოდინების შედარება თანჯგუფები ექსპერიმენტული პირობების ეფექტის დასადგენად, მისი სახელწოდება განპირობებულია იმით, რომ ძირითადი ინსტრუმენტი არის სხვადასხვა ტიპის დისპერსიების ანალიზი. თუ ნულოვანი ჰიპოთეზა მართალია და მათემატიკურ მოლოდინებს შორის თანჯგუფებში მნიშვნელოვანი განსხვავებები არ არის, სამივე ვარიაცია - MSA, MSW და MST - არის ვარიაციის შეფასება. σ 2გაანალიზებული მონაცემების თანდაყოლილი. ამრიგად, ნულოვანი ჰიპოთეზის შესამოწმებლად H 0: μ 1 = μ 2 = ... = μ sდა ალტერნატიული ჰიპოთეზა H 1: ყველა μ j არ არის ერთნაირი = 1, 2, …, თან), აუცილებელია სტატისტიკის გამოთვლა -კრიტერიუმი, რომელიც არის ორი დისპერსიის თანაფარდობა, MSA და MSW. ტესტი -სტატისტიკა ცალმხრივი დისპერსიის ანალიზში

სტატისტიკა - კრიტერიუმებს ექვემდებარება -დარიგება s – 1თავისუფლების ხარისხი მრიცხველში მ.ს.ა.და n – sთავისუფლების ხარისხი მნიშვნელში M.S.W.. მოცემული მნიშვნელოვნების α დონისთვის, ნულოვანი ჰიპოთეზა უარყოფილია, თუ გამოითვლება , თანდაყოლილი -დარიგება s – 1 n – sთავისუფლების ხარისხი მნიშვნელში. ამრიგად, როგორც ნაჩვენებია ნახ. 4, გადაწყვეტილების წესი ჩამოყალიბებულია შემდეგნაირად: ნულოვანი ჰიპოთეზა H 0უარყოფილია თუ F>F; წინააღმდეგ შემთხვევაში არ არის უარყოფილი.

ბრინჯი. 4. დისპერსიის ანალიზის კრიტიკული არეალი ჰიპოთეზის ტესტირებისას H 0

თუ ნულოვანი ჰიპოთეზა H 0მართალია, გათვლილი - სტატისტიკა ახლოს არის 1-თან, ვინაიდან მისი მრიცხველი და მნიშვნელი არის ერთი და იგივე რაოდენობის შეფასება - დისპერსია σ 2, რომელიც თან ახლავს გაანალიზებულ მონაცემებს. თუ ნულოვანი ჰიპოთეზა H 0არის მცდარი (და მნიშვნელოვანი განსხვავებაა სხვადასხვა ჯგუფის მათემატიკურ მოლოდინებს შორის), გამოთვლილი - სტატისტიკა ერთზე ბევრად დიდი იქნება, რადგან მისი მრიცხველი, MSA, მონაცემების ბუნებრივი ცვალებადობის გარდა, აფასებს ექსპერიმენტული პირობების ეფექტს ან განსხვავებას ჯგუფებს შორის, ხოლო მნიშვნელი MSW აფასებს მხოლოდ მონაცემთა ბუნებრივ ცვალებადობას. . ამრიგად, ANOVA პროცედურა არის - კრიტერიუმი, რომელშიც, მოცემულ მნიშვნელოვნების დონეზე α, ნულოვანი ჰიპოთეზა უარყოფილია, თუ გამოითვლება - სტატისტიკა აღემატება ზედა კრიტიკულ მნიშვნელობას , თანდაყოლილი -დარიგება s – 1თავისუფლების ხარისხი მრიცხველში და n – sთავისუფლების ხარისხი მნიშვნელში, როგორც ნაჩვენებია ნახ. 4.

დისპერსიის ცალმხრივი ანალიზის საილუსტრაციოდ, დავუბრუნდეთ ჩანაწერის დასაწყისში გამოკვეთილ სცენარს. ექსპერიმენტის მიზანია დადგინდეს, აქვთ თუ არა სხვადასხვა მომწოდებლებისგან მიღებული სინთეტიკური ბოჭკოებისგან ნაქსოვი პარაშუტები ერთნაირი სიმტკიცე. თითოეულ ჯგუფს აქვს ხუთი პარაშუტი. ჯგუფები იყოფა მიმწოდებლის მიხედვით - მომწოდებელი 1, მომწოდებელი 2, მომწოდებელი 3 და მიმწოდებელი 4. პარაშუტების სიძლიერე იზომება სპეციალური ხელსაწყოს გამოყენებით, რომელიც ამოწმებს ქსოვილს ორივე მხრიდან გახეხვაზე. პარაშუტის გასატეხად საჭირო ძალა იზომება სპეციალური მასშტაბით. რაც უფრო მაღალია გატეხვის ძალა, მით უფრო ძლიერია პარაშუტი. Excel საშუალებას გაძლევთ გაანალიზოთ - სტატისტიკა ერთი დაწკაპუნებით. გაიარეთ მენიუ მონაცემებიᲛონაცემთა ანალიზიდა აირჩიეთ ხაზი ცალმხრივი ANOVA, შეავსეთ ფანჯარა, რომელიც იხსნება (სურ. 5). ექსპერიმენტული შედეგები (გატეხვის სიძლიერე), ზოგიერთი აღწერილობითი სტატისტიკა და ცალმხრივი დისპერსიის ანალიზის შედეგები წარმოდგენილია ნახ. 6.

ბრინჯი. 5. ფანჯარა ცვალებადობის ანალიზის ცალმხრივი ანალიზის პაკეტი Excel

ბრინჯი. 6. სხვადასხვა მომწოდებლებისგან მიღებული სინთეზური ბოჭკოებისგან ნაქსოვი პარაშუტების სიძლიერის ინდიკატორები, აღწერითი სტატისტიკა და ცალმხრივი დისპერსიული ანალიზის შედეგები

სურათი 6-ის ანალიზი გვიჩვენებს, რომ არსებობს გარკვეული განსხვავება ნიმუშის საშუალებებს შორის. პირველი მიმწოდებლისგან მიღებული ბოჭკოების საშუალო სიმტკიცე არის 19,52, მეორისგან - 24,26, მესამედან - 22,84 და მეოთხედან - 21,16. არის ეს განსხვავება სტატისტიკურად მნიშვნელოვანი? რღვევის ძალის განაწილება ნაჩვენებია გაფანტულ ნახაზზე (ნახ. 7). ის ნათლად აჩვენებს განსხვავებებს როგორც ჯგუფებს შორის, ასევე მათ შიგნით. თუ თითოეული ჯგუფი ზომით უფრო დიდი იყო, მათ გასაანალიზებლად შეიძლებოდა გამოეყენებინათ ღერო-ფოთლის დიაგრამა, ყუთის დიაგრამა ან ზარის დიაგრამა.

ბრინჯი. 7. ოთხი მომწოდებლისგან მიღებული სინთეტიკური ბოჭკოებისგან ნაქსოვი პარაშუტების სიმტკიცის დისპერსიის დიაგრამა.

ნულოვანი ჰიპოთეზა აცხადებს, რომ არ არსებობს მნიშვნელოვანი განსხვავებები საშუალო სიმტკიცის ქულებს შორის: H 0: μ 1 = μ 2 = μ 3 = μ 4. ალტერნატიული ჰიპოთეზა არის ის, რომ არის მინიმუმ ერთი მიმწოდებელი, რომლის ბოჭკოს საშუალო სიძლიერე განსხვავდება სხვებისგან: H 1: ყველა μ j არ არის ერთნაირი ( = 1, 2, …, თან).

საერთო საშუალო (იხ. სურ. 6) = AVERAGE(D12:D15) = 21,945; დასადგენად, თქვენ ასევე შეგიძლიათ საშუალოდ ყველა 20 ორიგინალური რიცხვი: = AVERAGE(A3:D7). ვარიაციის მნიშვნელობები გამოითვლება ანალიზის პაკეტიდა აისახება ფირფიტაზე დისპერსიის ანალიზი(იხ. სურ. 6): SSA = 63.286, SSW = 97.504, SST = 160.790 (იხ. სვეტი SSმაგიდები დისპერსიის ანალიზისურათი 6). საშუალოები გამოითვლება კვადრატების ამ ჯამების გაყოფით თავისუფლების ხარისხების შესაბამის რაოდენობაზე. Იმიტომ რომ თან= 4, ა = 20, ჩვენ ვიღებთ თავისუფლების ხარისხის შემდეგ მნიშვნელობებს; SSA-სთვის: s – 1= 3; SSW-სთვის: n–c= 16; SST-სთვის: n – 1= 19 (იხ. სვეტი დფ). ამრიგად: MSA = SSA / ( s – 1)= 21.095; MSW = SSW / ( n–c) = 6.094; MST = SST / ( n – 1) = 8.463 (იხ. სვეტი ᲥᲐᲚᲑᲐᲢᲝᲜᲘ). -სტატისტიკა = MSA / MSW = 3.462 (იხ. სვეტი ).

ზედა კრიტიკული მნიშვნელობა , დამახასიათებელი -განაწილება, განისაზღვრება ფორმულით =F.OBR(0.95;3;16) = 3.239. ფუნქციის პარამეტრები =F.OBR(): α = 0,05, მრიცხველს აქვს თავისუფლების სამი ხარისხი, ხოლო მნიშვნელს აქვს 16. ამრიგად, გამოთვლილი -3.462-ის ტოლი სტატისტიკა აღემატება ზედა კრიტიკულ მნიშვნელობას = 3.239, ნულოვანი ჰიპოთეზა უარყოფილია (ნახ. 8).

ბრინჯი. 8. დისპერსიის ანალიზის კრიტიკული რეგიონი 0,05 მნიშვნელოვნების დონეზე, თუ მრიცხველს აქვს თავისუფლების სამი ხარისხი და მნიშვნელი არის -16.

- ღირებულება, ე.ი. ალბათობა იმისა, რომ თუ ნულოვანი ჰიპოთეზა მართალია - სტატისტიკა არანაკლებ 3,46, ტოლია 0,041 ან 4,1% (იხ. სვეტი p-მნიშვნელობამაგიდები დისპერსიის ანალიზისურათი 6). ვინაიდან ეს მნიშვნელობა არ აღემატება მნიშვნელოვნების დონეს α = 5%, ნულოვანი ჰიპოთეზა უარყოფილია. უფრო მეტიც, -მნიშვნელობა მიუთითებს იმაზე, რომ საერთო პოპულაციების მათემატიკურ მოლოდინებს შორის ასეთი ან უფრო დიდი სხვაობის გამოვლენის ალბათობა, იმ პირობით, რომ ისინი რეალურად იგივეა, უდრის 4,1%-ს.

Ისე. არსებობს განსხვავება ოთხ ნიმუშს შორის. ნულოვანი ჰიპოთეზა იყო, რომ ოთხი პოპულაციის ყველა მათემატიკური მოლოდინი თანაბარია. ამ პირობებში, ყველა პარაშუტის სიძლიერის მთლიანი ცვალებადობის (ანუ მთლიანი SST ვარიაცია) გამოითვლება თითოეულ დაკვირვებას შორის კვადრატული განსხვავებების შეჯამებით. X ijდა საერთო საშუალო . შემდეგ მთლიანი ვარიაცია იყოფა ორ კომპონენტად (იხ. სურ. 1). პირველი კომპონენტი იყო ჯგუფთაშორისი ვარიაცია SSA-ში და მეორე იყო შიდაჯგუფური ვარიაცია SSW-ში.

რა ხსნის მონაცემების ცვალებადობას? სხვა სიტყვებით რომ ვთქვათ, რატომ არ არის ყველა დაკვირვება ერთნაირი? ერთი მიზეზი ის არის, რომ სხვადასხვა კომპანია აწვდის სხვადასხვა სიძლიერის ბოჭკოებს. ეს ნაწილობრივ განმარტავს, თუ რატომ აქვთ ჯგუფებს განსხვავებული მათემატიკური მოლოდინი: რაც უფრო ძლიერია ექსპერიმენტული პირობების ეფექტი, მით უფრო დიდია განსხვავება ჯგუფების მათემატიკურ მოლოდინებს შორის. მონაცემთა ცვალებადობის კიდევ ერთი მიზეზი არის ნებისმიერი პროცესის ბუნებრივი ცვალებადობა, ამ შემთხვევაში პარაშუტების წარმოება. მაშინაც კი, თუ ყველა ბოჭკო შეძენილი უნდა იყოს ერთი და იგივე მომწოდებლისგან, მათი სიძლიერე არ იქნება იგივე, ყველა დანარჩენი თანაბარი იქნება. იმის გამო, რომ ეს ეფექტი ხდება თითოეულ ჯგუფში, მას უწოდებენ ჯგუფურ ვარიაციას.

განსხვავებებს ნიმუშის საშუალებებს შორის ეწოდება ჯგუფთაშორისი ვარიაცია SSA. ჯგუფური ვარიაციის ნაწილი, როგორც უკვე აღინიშნა, აიხსნება მონაცემების სხვადასხვა ჯგუფთან მიკუთვნებით. თუმცა, მაშინაც კი, თუ ჯგუფები ზუსტად იგივე იქნებოდა (ანუ ნულოვანი ჰიპოთეზა მართალი იყო), ჯგუფს შორის ვარიაცია მაინც იარსებებდა. ამის მიზეზი პარაშუტის წარმოების პროცესის ბუნებრივი ცვალებადობაა. იმის გამო, რომ ნიმუშები განსხვავებულია, მათი ნიმუშის საშუალებები განსხვავდება ერთმანეთისგან. მაშასადამე, თუ ნულოვანი ჰიპოთეზა ჭეშმარიტია, ორივე ჯგუფის ცვალებადობა წარმოადგენს პოპულაციის ცვალებადობის შეფასებას. თუ ნულოვანი ჰიპოთეზა მცდარია, ჯგუფთა ჰიპოთეზა უფრო დიდი იქნება. სწორედ ეს ფაქტი უდევს საფუძვლად - რამდენიმე ჯგუფის მათემატიკურ მოლოდინებს შორის განსხვავებების შედარების კრიტერიუმები.

ცალმხრივი ANOVA-ს განხორციელების და ფირმებს შორის მნიშვნელოვანი განსხვავების დადგენის შემდეგ, უცნობი რჩება რომელი მიმწოდებელი მნიშვნელოვნად განსხვავდება სხვებისგან. ჩვენ მხოლოდ ის ვიცით, რომ ზოგადი მოსახლეობის მათემატიკური მოლოდინები არ არის თანაბარი. სხვა სიტყვებით რომ ვთქვათ, მათემატიკური მოლოდინებიდან ერთი მაინც მნიშვნელოვნად განსხვავდება სხვებისგან. იმის დასადგენად, თუ რომელი მიმწოდებელი განსხვავდება სხვებისგან, შეგიძლიათ გამოიყენოთ Tukey პროცედურა, მომწოდებლებს შორის წყვილი შედარების გამოყენებით. ეს პროცედურა შეიმუშავა ჯონ ტუკეიმ. შემდგომში მან და კ. კრამერმა დამოუკიდებლად შეცვალეს ეს პროცედურა იმ სიტუაციებისთვის, რომლებშიც ნიმუშის ზომები განსხვავდება ერთმანეთისგან.

მრავალჯერადი შედარება: ტუკი-კრამერის პროცედურა

ჩვენს სცენარში, პარაშუტების სიძლიერის შესადარებლად გამოიყენეს დისპერსიის ცალმხრივი ანალიზი. ოთხი ჯგუფის მათემატიკურ მოლოდინებს შორის მნიშვნელოვანი განსხვავებების აღმოჩენის შემდეგ, აუცილებელია განვსაზღვროთ რომელი ჯგუფები განსხვავდებიან ერთმანეთისგან. მიუხედავად იმისა, რომ ამ პრობლემის გადაჭრის რამდენიმე გზა არსებობს, ჩვენ მხოლოდ ტუკი-კრამერის მრავალჯერადი შედარების პროცედურას აღვწერთ. ეს მეთოდი არის პოსტ-ჰოკ შედარების პროცედურების მაგალითი, რადგან შემოწმებული ჰიპოთეზა ჩამოყალიბებულია მონაცემთა ანალიზის შემდეგ. Tukey-Kramer პროცედურა საშუალებას აძლევს ყველა წყვილი ჯგუფის ერთდროულად შედარება. პირველ ეტაპზე განსხვავებები გამოითვლება X -X, სად j ≠, მათემატიკურ მოლოდინებს შორის s(s – 1)/2ჯგუფები. კრიტიკული ფარგლები Tukey-Kramer პროცედურა გამოითვლება ფორმულით:

სად Q U- სტუდენტური დიაპაზონის განაწილების ზედა კრიტიკული მნიშვნელობა, რომელსაც აქვს თანთავისუფლების ხარისხი მრიცხველში და - თანთავისუფლების ხარისხი მნიშვნელში.

თუ ნიმუშის ზომები არ არის იგივე, კრიტიკული დიაპაზონი გამოითვლება მათემატიკური მოლოდინების თითოეული წყვილისთვის ცალ-ცალკე. ბოლო ეტაპზე, თითოეული s(s – 1)/2მათემატიკური მოლოდინების წყვილი შედარებულია შესაბამის კრიტიკულ დიაპაზონთან. წყვილის ელემენტები მნიშვნელოვნად განსხვავებულად ითვლება, თუ განსხვავების მოდული | X ჯ -X| მათ შორის აღემატება კრიტიკულ დიაპაზონს.

გამოვიყენოთ თუკი-კრამერის პროცედურა პარაშუტების სიძლიერის პრობლემაზე. ვინაიდან პარაშუტის კომპანიას ჰყავს ოთხი მომწოდებელი, არის 4(4 – 1)/2 = 6 წყვილი მომწოდებლის შესამოწმებლად (სურათი 9).

ბრინჯი. 9. ნიმუშის საშუალებების წყვილი შედარება

ვინაიდან ყველა ჯგუფს აქვს იგივე მოცულობა (ანუ ყველა n j = n j), საკმარისია მხოლოდ ერთი კრიტიკული დიაპაზონის გამოთვლა. ამისათვის, ცხრილის მიხედვით ANOVA(ნახ. 6) ვადგენთ მნიშვნელობას MSW = 6.094. შემდეგ ჩვენ ვიპოვით მნიშვნელობას Q Uα = 0.05-ზე, თან= 4 (თავისუფლების გრადუსების რაოდენობა მრიცხველში) და - თან= 20 – 4 = 16 (თავისუფლების გრადუსების რაოდენობა მნიშვნელში). სამწუხაროდ, Excel-ში შესაბამისი ფუნქცია ვერ ვიპოვე და გამოვიყენე ცხრილი (ნახ. 10).

ბრინჯი. 10. სტუდენტური დიაპაზონის კრიტიკული მნიშვნელობა Q U

ჩვენ ვიღებთ:

ვინაიდან მხოლოდ 4.74 > 4.47 (იხ. ნახ. 9-ის ქვედა ცხრილი), სტატისტიკურად მნიშვნელოვანი განსხვავებაა პირველ და მეორე მიმწოდებელს შორის. ყველა სხვა წყვილს აქვს სანიმუშო საშუალებები, რომლებიც არ გვაძლევს საშუალებას ვისაუბროთ მათ განსხვავებაზე. შესაბამისად, პირველი მომწოდებლისგან ნაქსოვი ბოჭკოებისგან ნაქსოვი პარაშუტების საშუალო სიძლიერე მნიშვნელოვნად ნაკლებია მეორეზე.

ცალმხრივი დისპერსიული ანალიზისთვის აუცილებელი პირობები

პარაშუტების სიძლიერის პრობლემის გადაჭრისას ჩვენ არ შევამოწმეთ არის თუ არა პირობები, რომლებშიც შესაძლებელია ერთი ფაქტორის გამოყენება -კრიტერიუმი. როგორ იცით, შეგიძლიათ თუ არა ერთი ფაქტორის გამოყენება -კრიტერიუმი კონკრეტული ექსპერიმენტული მონაცემების გაანალიზებისას? ერთი ფაქტორი - კრიტერიუმი შეიძლება გამოყენებულ იქნას მხოლოდ იმ შემთხვევაში, თუ დაკმაყოფილებულია სამი ძირითადი დაშვება: ექსპერიმენტული მონაცემები უნდა იყოს შემთხვევითი და დამოუკიდებელი, ჰქონდეს ნორმალური განაწილება და მათი დისპერსიები უნდა იყოს თანაბარი.

პირველი გამოცნობა - შემთხვევითობა და მონაცემთა დამოუკიდებლობა- ყოველთვის უნდა შესრულდეს, რადგან ნებისმიერი ექსპერიმენტის სისწორე დამოკიდებულია არჩევანის შემთხვევითობაზე და/ან რანდომიზაციის პროცესზე. შედეგების მიკერძოების თავიდან ასაცილებლად, აუცილებელია მონაცემების ამოღება თანზოგადი პოპულაციები შემთხვევით და ერთმანეთისგან დამოუკიდებლად. ანალოგიურად, მონაცემები უნდა გადანაწილდეს შემთხვევითად თანჩვენთვის დაინტერესებული ფაქტორის დონეები (ექსპერიმენტული ჯგუფები). ამ პირობების დარღვევამ შეიძლება სერიოზულად დაამახინჯოს დისპერსიული ანალიზის შედეგები.

მეორე გამოცნობა - ნორმალურობა- ნიშნავს, რომ მონაცემები მოპოვებულია ნორმალურად განაწილებული პოპულაციებიდან. რაც შეეხება -კრიტერიუმები, ცალმხრივი დისპერსიის ანალიზი ეფუძნება - კრიტერიუმი შედარებით ნაკლებად მგრძნობიარეა ამ მდგომარეობის დარღვევის მიმართ. თუ განაწილება ნორმალურიდან ძალიან მნიშვნელოვნად არ გადაიხრება, მნიშვნელოვნების დონე -კრიტერიუმი ოდნავ იცვლება, განსაკუთრებით თუ ნიმუშის ზომა საკმარისად დიდია. თუ განაწილების ნორმალურობის პირობა სერიოზულად ირღვევა, ის უნდა იქნას გამოყენებული.

მესამე ვარაუდი - დისპერსიის ჰომოგენურობა- ნიშნავს, რომ თითოეული პოპულაციის ვარიაციები ერთმანეთის ტოლია (ე.ი. σ 1 2 = σ 2 2 = ... = σ j 2). ეს ვარაუდი საშუალებას აძლევს ადამიანს გადაწყვიტოს, განცალკევდეს თუ დააგროვოს ჯგუფში არსებული დისპერსიები. თუ ჯგუფის ზომები ერთნაირია, დისპერსიის ერთგვაროვნების პირობა მცირე გავლენას ახდენს გამოყენებით მიღებულ დასკვნებზე - კრიტერიუმები. თუმცა, თუ ნიმუშის ზომები არათანაბარია, დისპერსიების თანასწორობის პირობის დარღვევამ შეიძლება სერიოზულად დაამახინჯოს დისპერსიული ანალიზის შედეგები. ამიტომ, ძალისხმევა უნდა გაკეთდეს იმისათვის, რომ ნიმუშის ზომები თანაბარი იყოს. ცვალებადობის ერთგვაროვნების დაშვების შემოწმების ერთ-ერთი მეთოდი კრიტერიუმია ლევენიქვემოთ აღწერილი.

თუ სამივე პირობიდან ირღვევა მხოლოდ დისპერსიის ერთგვაროვნების პირობა, პროცედურა მსგავსია -კრიტერიუმი ცალკე დისპერსიის გამოყენებით (დაწვრილებით იხ.). თუმცა, თუ ნორმალური განაწილებისა და ვარიაციის ერთგვაროვნების დაშვება ერთდროულად ირღვევა, საჭიროა მონაცემთა ნორმალიზება და განსხვავებათა შორის განსხვავებების შემცირება ან არაპარამეტრული პროცედურის გამოყენება.

ლევენის ტესტი დისპერსიის ჰომოგენურობის შესამოწმებლად

მიუხედავად იმისა - კრიტერიუმი შედარებით მდგრადია ჯგუფებში განსხვავებების თანასწორობის პირობის დარღვევის მიმართ; ამ დაშვების უხეში დარღვევა მნიშვნელოვნად აისახება კრიტერიუმის მნიშვნელოვნებისა და სიმძლავრის დონეზე. ალბათ ერთ-ერთი ყველაზე ძლიერი კრიტერიუმია ლევენი. დისპერსიების ტოლობის შესამოწმებლად თანზოგადად მოსახლეობისთვის, ჩვენ შევამოწმებთ შემდეგ ჰიპოთეზებს:

Н 0: σ 1 2 = σ 2 2 = … = σ 2

H 1: Ყველა არა σ j 2იგივეა ( = 1, 2, …, თან)

შეცვლილი ლევენის ტესტი ეფუძნება განცხადებას, რომ თუ ჯგუფებში ცვალებადობა იგივეა, დაკვირვებებსა და ჯგუფურ მედიანებს შორის განსხვავებების აბსოლუტური მნიშვნელობების დისპერსიის ანალიზი შეიძლება გამოყენებულ იქნას ცვალებადობის ტოლობის ნულოვანი ჰიპოთეზის შესამოწმებლად. ასე რომ, თქვენ ჯერ უნდა გამოთვალოთ თითოეულ ჯგუფში დაკვირვებებსა და მედიანებს შორის განსხვავებების აბსოლუტური მნიშვნელობები, შემდეგ კი განახორციელოთ განსხვავებების ცალმხრივი ანალიზი განსხვავებების აბსოლუტურ მნიშვნელობებზე. ლევენის კრიტერიუმის საილუსტრაციოდ, დავუბრუნდეთ ჩანაწერის დასაწყისში ასახულ სცენარს. ნახ. 6, ჩვენ ჩავატარებთ მსგავს ანალიზს, ოღონდ საწყის მონაცემებსა და მედიანებში განსხვავებების მოდულებთან მიმართებაში თითოეული ნიმუშისთვის ცალკე (ნახ. 11).

უახლესი მასალები განყოფილებაში:

სტრიქონებს შორის მოსმენა რას ნიშნავს სტრიქონებს შორის წაკითხული გამოთქმა?
სტრიქონებს შორის მოსმენა რას ნიშნავს სტრიქონებს შორის წაკითხული გამოთქმა?

წაიკითხეთ სტრიქონებს შორის წაიკითხეთ სტრიქონებს შორის (უცხო ენა), რათა გამოიცნოთ რა არ არის დაწერილი ან შეთანხმებული. Ოთხ. მაგრამ მის მტკივნეულ სტრიქონებს შორის...

გრაფიკების აგების წესები
გრაფიკების აგების წესები

გრაფიკები იძლევა სიდიდეებს შორის ურთიერთობის ვიზუალურ წარმოდგენას, რაც ძალზე მნიშვნელოვანია მიღებული მონაცემების ინტერპრეტაციისას, ვინაიდან გრაფიკული...

პირველი რუსული მოგზაურობა მთელს მსოფლიოში
პირველი რუსული მოგზაურობა მთელს მსოფლიოში

რუსი ნავიგატორები, ევროპელებთან ერთად, ყველაზე ცნობილი პიონერები არიან, რომლებმაც აღმოაჩინეს ახალი კონტინენტები, მთის ქედების მონაკვეთები და უზარმაზარი...