Konstruiranje intervala zaupanja za napovedano vrednost. kjer je n število ravni časovne vrste, za katero je bila določena vrednost napovedi

Ena izmed osrednjih nalog ekonometričnega modeliranja je napovedovanje (napovedovanje) vrednosti odvisne spremenljivke za določene vrednosti pojasnjevalnih spremenljivk za določene vrednosti pojasnjevalnih spremenljivk. Tukaj je možen dvojni pristop: bodisi napovedati pogojno matematično pričakovanje odvisne spremenljivke ( srednja napoved), ali napovedati določeno vrednost odvisne spremenljivke ( napoved določene vrednosti).

Komentiraj. Nekateri avtorji razlikujejo pojma, kot sta napovedovanje in napovedovanje. Če vrednost pojasnjevalne spremenljivke X natančno poznan, potem je ocena odvisne spremenljivke Y klical napoved. Če vrednost pojasnjevalne spremenljivke X ne ve natančno, potem pravijo, kaj se dela napoved vrednosti Y. To stanje je značilno za časovne vrste. V tem primeru ne bomo razlikovali med napovedjo in napovedjo.

Razlikovati spot in interval napovedovanje. V prvem primeru je ocena določeno število, v drugem pa interval, v katerem se nahaja prava vrednost odvisne spremenljivke z dano stopnjo pomembnosti.

A) Napovedovanje povprečja. Naj bo sestavljena parna regresijska enačba, na podlagi katere je potrebno napovedati pogojno matematično pričakovanje . V tem primeru vrednost je točkovna ocena . Potem se seveda pojavi vprašanje, koliko lahko vrednost modela, izračunana z empirično enačbo, odstopa od ustrezne pogojne matematično pričakovanje. Odgovor na to vprašanje je podan na podlagi intervalnih ocen, izdelanih z dano stopnjo pomembnosti a za katero koli specifično vrednost xp pojasnjevalna spremenljivka.

Zapišimo empirična enačba regresijo v obliki

Tu sta poudarjeni dve neodvisni komponenti: povprečje in prirastek. Iz tega sledi, da bo varianca enaka

Iz teorije vzorčenja je znano, da

Uporaba preostale variance kot ocene s2 S 2, dobimo



Varianca regresijskega koeficienta, kot je že prikazano

Če nadomestimo najdene variance v (5.41), dobimo

. (5.56)

Tako je formula za izračun standardna napaka srednje vrednosti Y, napovedane iz regresijske črte izgleda kot

. (5.57)

Vrednost standardne napake, kot je razvidno iz formule, doseže minimum pri , in narašča z razdaljo od v kateri koli smeri. Z drugimi besedami, večja kot je razlika med in, večja je napaka, s katero je predvidena povprečna vrednost l Za nastavljeno vrednost xp. Lahko se pričakuje najboljše rezultate napoved, če so vrednosti xp so v središču opazovalnega območja X in ne moreš pričakovati dobri rezultati napoved, ko se oddaljujete od .

Naključna spremenljivka

(5.58)

ima Studentovo porazdelitev s prostostnimi stopnjami n= n–2 (znotraj običajen klasični model). Zato glede na tabelo kritičnih točk Studentove porazdelitve glede na zahtevano stopnjo pomembnosti a in število prostostnih stopenj n= n–2 je mogoče določiti kritična točka, ki izpolnjuje pogoj

.

Ob upoštevanju (5.46) imamo:

.

Od tod po nekaj algebraičnih transformacijah dobimo to interval zaupanja za ima obliko:

, (5.59)

kje mejna napaka D str izgleda kot

. (5.60)

Iz formul (5.57) in (5.60) je razvidno, da je vrednost (dolžina) intervala zaupanja odvisna od vrednosti pojasnjevalne spremenljivke xp: ko je minimalna in ko se oddaljuje xp od vrednosti intervala zaupanja se poveča (slika 5.4). Tako je napoved vrednosti odvisne spremenljivke Y po regresijski enačbi je upravičena, če vrednost xp pojasnjevalna spremenljivka X ne presega obsega svojih vzorčnih vrednosti (še več, bližje xp Za ). Z drugimi besedami, ekstrapolacija regresijske krivulje, tj. njegova uporaba zunaj raziskanega obsega vrednosti pojasnjevalne spremenljivke(tudi če je to upravičeno za zadevno spremenljivko glede na pomen problema, ki ga rešujemo) lahko povzroči pomembne napake.

b) Napovedovanje posameznih vrednosti odvisne spremenljivke. V praksi je včasih bolj pomembno poznati varianco Y kot njegova povprečja ali intervali zaupanja za pogojna matematična pričakovanja. To je zato, ker dejanske vrednosti Y gibljejo okoli povprečne vrednosti. Individualne vrednote Y lahko odstopa za količino naključne napake e, katere varianca je ocenjena kot preostala varianca na eno prostostno stopnjo S 2. Zato je napaka predvidenega individualni pomen Y mora vključevati ne samo standardno napako, ampak tudi naključno napako S. To vam omogoča, da določite sprejemljive meje za določeno vrednost Y.

Naj nas zanima kakšna možna vrednost l 0 spremenljivka Y pri določeni vrednosti xp pojasnjevalna spremenljivka X. Predvidena vrednost iz regresijske enačbe Y pri X=xp znaša y str. Če upoštevamo vrednost l 0 kot naključna spremenljivka Y 0 , a y str– kot naključna spremenljivka Yp, potem je mogoče ugotoviti, da

,

.

Naključne spremenljivke Y 0 in Yp sta neodvisni in torej naključna spremenljivka U=Y 0 –Yp ima normalna porazdelitev z

IN . (5.61)

Uporaba preostale variance kot s2 S 2, dobimo formulo za izračun standardna napaka posamezne vrednosti Y, napovedane iz regresijske črte:

. (5.63)

Naključna spremenljivka

(5.64)

ima Studentovo porazdelitev s številom prostostnih stopenj k=n–2. Na podlagi tega je mogoče sestaviti interval zaupanja za posamezne vrednosti Yp:

, (5.65)

kje mejna napaka D u izgleda kot

. (5.66)

Upoštevajte, da je ta interval širši od intervala zaupanja za pogojno matematično pričakovanje (glej sliko 5.4).

Primer 5.5. Na podlagi podatkov v primerih 5.1–5.3 izračunajte 95-odstotni interval zaupanja za pogojno matematično pričakovanje in posamezno vrednost pri xp=160.

rešitev. V primeru 5.1 je bilo ugotovljeno. Z uporabo formule (5.48) najdemo mejna napaka za pogojno matematično pričakovanje

Takrat bo interval zaupanja za povprečno vrednost pri stopnji pomembnosti a=0,05 videti takole

Povedano drugače, povprečna potrošnja z dohodkom 160 z verjetnostjo 0,95 bo v intervalu (149,8; 156,6).

Izračunajmo meje intervala, v katerem bo vsaj 95% možnih količin potrošnje koncentriranih na ravni dohodka. xp=160, tj. interval zaupanja za posamezno vrednost. Poiščimo mejno napako za posamezno vrednost

Nato interval, v katerem bo vsaj 95 % individualnih količin porabe pri dohodku xp= 160, izgleda

Preprosto je videti, da vključuje interval zaupanja za pogojno povprečno porabo. â

PRIMERI

Primer 5.65. Za območja regije so podani podatki za leto 199X (tabela 1.1).

2. Zgradite linearna enačba parna regresija l na x in ovrednotiti statistično pomembnost regresijskih parametrov. Narišite risbo.

3. Ocenite kakovost regresijske enačbe z uporabo koeficienta determinacije. Preverite kakovost regresijske enačbe z uporabo F- Fisherjev kriterij.

4. Izvedite napoved plače l pri predvideni vrednosti povprečne eksistenčne ravni na prebivalca x, kar je 107 % povprečja. Ocenite točnost napovedi z izračunom napake napovedi in njenega intervala zaupanja za stopnjo pomembnosti a=0,05. Potegnite zaključke.

rešitev

1. Za določitev stopnje tesnosti povezave se običajno uporablja korelacijski koeficient:

kjer so vzorčne variance spremenljivk x in l. Za izračun korelacijskega koeficienta sestavimo računsko tabelo (tabela 5.4):

Tabela 5.4

x l xy x 2 y 2 e 2
148,77 -15,77 248,70
152,45 -4,45 19,82
157,05 -23,05 531,48
149,69 4,31 18,57
158,89 3,11 9,64
174,54 20,46 418,52
138,65 0,35 0,13
157,97 0,03 0,00
144,17 7,83 61,34
157,05 4,95 24,46
146,93 12,07 145,70
182,83 -9,83 96,55
Skupaj 1574,92
Povprečna vrednost 85,58 155,75 13484,00 7492,25 24531,42

Glede na tabelo ugotovimo:

, , , ,

, , , ,

, .

torej Med plačami (y) in povprečnimi življenjskimi stroški na prebivalca (x) obstaja neposredna, precej močna korelacija. .

Za oceno statistična pomembnost korelacijski koeficient računajmo dvosmerno Študentov t-test:

ki ima študentsko distribucijo z k=n–2 in stopnjo pomembnosti a. V našem primeru

in .

Ker se korelacijski koeficient bistveno razlikuje od nič.

Za pomemben koeficient lahko konstruiramo interval zaupanja, ki z dana verjetnost vsebuje neznan splošni korelacijski koeficient. Za gradnjo intervalna ocena(za majhne vzorce n<30), используют Fisherjeva z-transformacija:

Distribucija zže pri malem n je približna normalna porazdelitev s pričakovanjem in varianco. Zato najprej zgradite interval zaupanja za M[ z] in nato naredite nasprotno z- preoblikovanje. Prijavljanje z-transformacija za najdeni korelacijski koeficient, dobimo

Interval zaupanja za M( z) bo imela obliko

,

kje t g najdemo z uporabo Laplaceove funkcije F( t g)=g/2. Za g=0,95 imamo t g = 1,96. Potem

ali . Vzvratno z- transformacija se izvede po formuli

Kot rezultat ugotovimo

.

V navedenih mejah se na stopnji pomembnosti 0,05 (z zanesljivostjo 0,95) nahaja splošni korelacijski koeficient r.

2. Tako med spremenljivkama x in l ima pomembno korelacijo. Predpostavili bomo, da je ta odvisnost linearna. Parni linearni regresijski model ima obliko

,

kje l– odvisna spremenljivka (rezultativni atribut), x– neodvisna (razlagalna) spremenljivka, e – naključni odkloni, b 0 in b 1 – regresijska parametra. Z uporabo omejene velikosti vzorca lahko sestavimo empirično regresijsko enačbo:

kje b 0 in b 1 – empirični regresijski koeficienti. Za oceno regresijskih parametrov običajno uporabljamo metoda najmanjših kvadratov (MNC). V skladu z OLS je vsota kvadratov odstopanj dejanskih vrednosti odvisne spremenljivke l od teoretičnih je bil minimalen:

,

kje odstopanja y i od ocenjene regresijske črte. Nujen pogoj za obstoj minimuma funkcije dveh spremenljivk je enakost nič njenih parcialnih odvodov glede na neznane parametre. b 0 in b 1. Kot rezultat dobimo sistem normalnih enačb:

Reševanje tega sistema, ugotovimo

, .

Po podatkih tabele najdemo

Dobljena regresijska enačba je:

Parameter b 1 se imenuje regresijski koeficient. Njegova vrednost prikazuje povprečno spremembo rezultata s spremembo faktorja za eno enoto. V obravnavanem primeru je s povečanjem povprečnega minimuma na prebivalca za 1 rub. povprečna dnevna plača se poveča v povprečju za 0,92 rublja .

,

kje F upošteva Fisherjevo porazdelitev s stopnjo pomembnosti a in prostostnimi stopnjami k 1 =1 in k 2 =n–2. V našem primeru

.

Ker je kritična vrednost kriterija

in , potem je priznana statistična pomembnost sestavljene regresijske enačbe. Upoštevajte, da za linearni model F- In t-kriteriji so povezani z enakostjo, kar lahko uporabimo za preverjanje izračunov.

4. Dobljene ocene regresijske enačbe omogočajo njeno uporabo za napovedovanje. Napovedana vrednost y str se določi z zamenjavo ustrezne (predvidene) vrednosti v regresijsko enačbo (1.16) xp

PREDAVANJE 5 99

§5.2. Analiza točnosti ocen regresijskih koeficientov 99

5.2.1. Ocena variance naključnega odklona 99

5.2.2. Preizkušanje hipotez glede regresijskih koeficientov 100

5.2.3. Intervalna ocena regresijskih koeficientov 103

§5.3. Indikatorji kakovosti regresijske enačbe 104

5.3.1. Koeficient determinacije 104

5.3.2. Preverjanje splošne kakovosti regresijske enačbe: F-test 106

5.3.3. Preverjanje splošne kakovosti regresijske enačbe: t-test 108

§5.4. Intervali napovedi z uporabo regresijske enačbe 108

Izračuni in preverjanje zanesljivosti dobljenih ocen regresijskih koeficientov niso sami sebi namen, temveč le nujna vmesna faza. Glavna stvar je uporaba modela za analizo in napovedovanje obnašanja preučevanega ekonomskega pojava. Napoved se izvede z zamenjavo vrednosti faktorja X v nastalo regresijsko formulo.

Za napoved obsega blagovne menjave uporabimo regresijsko enačbo, pridobljeno v primeru 2.1. Naj bo načrtovano odprtje trgovine s številom zaposlenih X=140 ljudi, potem je treba z enačbo ugotoviti dovolj utemeljen obseg trgovinskega prometa ŷ (X)= –0,974 + 0,01924×140=1,72 milijarde rubljev.

Interval zaupanja za napovedno vrednost pri(X)=a 0 +a 1 X določeno s formulo

kjer je t p kritična meja Studentove porazdelitve z n – 2 stopnjama svobode, ki ustreza stopnji pomembnosti r. Za pridobitev intervala zaupanja uporabimo izraz (5.2).

Izberimo stopnjo pomembnosti 5%. Naše število prostostnih stopenj je 8 – 2 = 6, nato iz tabele študentove porazdelitve (priloga 1) najdemo

t 0,05 (6)=2,447.s=Ö 0,008=0,089,

zato bodo s 95-odstotno verjetnostjo prave vrednosti obsega trgovinskega prometa znotraj

1,72 – 2,447×0,048<l(x)<1,72+2,447×0,048, или 1,60<l(x)<1,84.

5.8. Praktični blok

Primer. Zgradite model razmerja med temi dejavniki, preverite njegovo ustreznost, izvedite točkovne in intervalne napovedi z metodo ekstrapolacije.

1 . Izdelajte razpršeni diagram v EXCEL in naredite predhodni sklep o prisotnosti povezave.

Tabela 5.6 Diagram 5.1

x Y
2,1 29,5
2,9 34,2
3,3 30,6
3,8 35,2
4,2 40,7
3,9 44,5
5,0 47,2
4,9 55,2
6,3 51,8
5,8 56,7

Zaključek: Iz diagrama 5.1 je razvidno, da razmerje med faktorji x in l

neposredna močna linearna povezava.

2. Izračunajte linearni korelacijski koeficient. S Studentovim t-testom preverite pomembnost korelacijskega koeficienta. Naredite sklep o tesnem odnosu med dejavniki X in pri.

Tabela 5.7

xy
2,1 29,5 4,41 870,25 61,95 27,91 1,59 0,054
2,9 34,2 8,41 1169,64 99,18 33,46 0,74 0,022
3,3 30,6 10,89 936,36 100,98 36,23 -5,63 0,184
3,8 35,2 14,44 1239,04 133,76 39,69 -4,49 0,128
4,2 40,7 17,64 1656,49 170,94 42,47 -1,77 0,043
3,9 44,5 15,21 1980,25 173,55 40,39 4,11 0,092
5,0 47,2 2227,84 48,01 -0,81 0,017
4,9 55,2 24,01 3047,04 270,48 47,32 7,88 0,143
6,3 51,8 39,69 2683,24 326,34 57,02 -5,22 0,101
5,8 56,7 33,64 3214,89 328,86 53,55 3,15 0,056
SKUPAJ: 42,2 193,34 19025,04 1902,04 0,840
Povprečna vrednost 4,22 42,56 19,334 1902,504 190,204

2.1. Preverimo tesnost povezave med dejavniki:

;

Zaključek: komunikacija močan.

2.2 Preverimo statistično značilnost s Studentovim testom:

1) Študentov kriterij: tselekt<=tкр

2)N o: r=0 tcr=2,31

tselect=rselect*

Zaključek: torej, ker je tselect = 5,84

90 % ničelne hipoteze je zavrnjenih, kar kaže na prisotnost močna linearna povezava.

3. V prepričanju, da razmerje med dejavniki X in pri lahko opišemo z linearno funkcijo, z uporabo postopka najmanjših kvadratov napišemo sistem normalnih enačb za koeficiente enačbe linearne regresije. Izračunajte te koeficiente s katero koli metodo.

Z dosledno zamenjavo v regresijsko enačbo iz stolpca (2) tabele 5.7 izračunamo vrednosti in izpolnimo stolpec (7) tabele 5.7.

4. Za dobljeni model razmerja med faktorjema X in Y izračunajte povprečno napako približka. Naredite predhodni sklep o sprejemljivosti nastalega modela.

Za izračun izpolnite 8. in 9. stolpec tabele 5.7.

<Екр=12%

Zaključek: model je treba šteti za zadovoljivega.

5 . Preverite pomembnost koeficienta regresijske enačbe a 1 na podlagi Studentovega t-testa.

Rešitev: Tabela 5.8

2,1 29,5 27,91 2,5281 214,623 170,5636
2,9 34,2 33,46 0,5476 82,81 69,8896
3,3 30,6 36,23 31,6969 40,069 143,0416
3,8 35,2 39,69 20,1601 8,237 54,1696
4,2 40,7 42,47 3,1329 0,008 3,4596
3,9 44,5 40,39 16,8921 4,709 3,7636
47,2 48,01 0,6561 29,703 21,5296
4,9 55,2 47,32 62,0944 22,658 159,7696
6,3 51,8 57,02 27,2484 209,092 85,3776
5,8 56,7 53,55 9,9225 120,78 199,9396
SKUPAJ: 42,2 425,6 426,1 174,8791 732,687 911,504
Povprečje 4,22 42,56

Statistični pregled:

Zaključek: Z verjetnostjo zaupanja 90 % koeficienta a 1 - statistično značilno, tj. ničelna hipoteza je zavrnjena.

6. Preverite ustreznost modela (regresijske enačbe) kot celote na podlagi Fisher-Snedecor F testa.

Postopek statističnega testiranja:

:model ni primeren

Zaključek: ker Fselect>Fcr, potem je z verjetnostjo zaupanja 95 % nična hipoteza zavrnjena (tj. alternativa je sprejeta). Model, ki ga preučujemo, je ustrezen in se lahko uporablja za napovedovanje in sprejemanje upravljavskih odločitev.

7. Izračunajte empirični koeficient determinacije.

(tab. 3)

Prikazuje delež variacije.

Zaključek: tj. 80 % variacije pojasnjujejo dejavniki, vključeni v model, 20 % pa dejavniki, ki niso vključeni v model.

8. Izračunajte korelacijsko razmerje. Dobljeno vrednost primerjajte z vrednostjo linearnega korelacijskega koeficienta.

Empirično korelacijsko razmerje kaže tesnost odnosa med dvema faktorjema za katero koli razmerje, če je razmerje linearno, tj. korelacijski koeficient sovpada s determinacijskim koeficientom.

9 . Izvedite točkovno napoved za .

10-12 . Izračunajte intervale zaupanja za regresijsko enačbo in za dobljeno karakteristiko pri stopnji zaupanja =90 %. Nariši v enem koordinatnem sistemu:

a) začetni podatki,

b) regresijska črta,

c) napoved točk,

d) 90 % intervali zaupanja.

Oblikujte splošen sklep o dobljenem modelu.

-matematično pričakovanje povprečja.

Za izvedbo intervalne napovedi upoštevamo dve področji.

1) za l s področja spremembe dejavnikov x Meje zaupanja za enačbo linearne regresije se izračunajo po formuli:

2) za predvideno vrednost se interval zaupanja za izračuna po formuli:

Začetni podatki:

2) t=2,31(tab.)

5) : 27,91 42,56 57,02 66,72

6) 19,334-4,22 2)=1,53.

Tabela 5.9

1 2,1 -2,12 4,49 3,03 1,74 2,31 4,68 18,81 27,91 9,10 46,72
4,22 0,00 0,00 0,1 0,32 2,31 4,68 3,46 42,56 39,10 46,02
6,3 2,08 4,33 2,93 1,71 2,31 4,68 18,49 57,02 38,53 75,51
7,7 3,48 12,11 9,02 2,31 4,68 32,43 66,72 34,29 99,15

Zaključek: Ker je 90 % opazovalnih točk padlo v 90-odstotni interval zaupanja, se lahko ta model in njegove meje zaupanja uporabijo za napovedi z 90-odstotno stopnjo zaupanja.

Varnostna vprašanja

1. Modeli linearne regresije s heteroskedastičnimi in avtokoreliranimi reziduali.

2. Vrste avtokorelacije in njihove kratke značilnosti.

3. Avtokorelacija v rezidualih in postopek za njeno detekcijo.

4. Vrste avtokorelacije v rezidualih.

5. Postopek za uporabo Durbin-Watsonovega kriterija.

6. Avtokorelacija v izvornih podatkih in postopek ugotavljanja njene prisotnosti.

7. Metode za odpravo vpliva avtokorelacije na rezultate napovedovanja.

8. Posplošena metoda najmanjših kvadratov (GLM).

9. Kaj pomeni homoskedastičnost?

10. Kako se testira hipoteza o homoskedastičnosti niza ostankov?

11. Regresijska ocena kakovosti. Preverjanje ustreznosti in zanesljivosti modela.

12. Pomen regresijskih koeficientov (Studentov t test).

13. Analiza variance. Preverjanje zanesljivosti modela odnosa (s Fisherjevim F testom).

14. Korelacijski koeficienti in indeksi. Večstranskost.

15. Ocenjevanje pomembnosti korelacije. Odločnost.

16. Povprečna napaka aproksimacije.

17. Odločanje na podlagi regresijskih enačb.

18. Pri katerih ekonometričnih problemih se uporablja Fisherjeva porazdelitev?

19. Katere porazdelitvene tabele se uporabljajo za oceno kakovosti linearne regresije?

20. Kakšne so značilnosti praktične uporabe regresijskih modelov?

21. Kako se napovedujejo ekonomski kazalci z uporabo linearnih regresijskih modelov?

22. Kako lahko ocenite »naravno« stopnjo brezposelnosti z uporabo linearnega regresijskega modela?

23. V katerih primerih je potrebno izpopolniti linearni regresijski model in kako se to izvede?

24. Kdaj je treba iz obravnave črtati nepomembne pojasnjevalne spremenljivke in dodati nove?

Naloge in naloge

1 . Obstajajo podatki o dejavnostih največjih ameriških podjetij v letu 2006.

št. Čisti dobiček, milijarde ameriških dolarjev, pri Obrat kapitala, milijarde ameriških dolarjev, X 1 Uporabljeni kapital, milijarde ameriških dolarjev, X 2 Število zaposlenih, tisoč ljudi, X 3 Tržna kapitalizacija podjetja, milijarde ameriških dolarjev, X 4
0,9 31,3 18,9 43,0 40,9
1,7 13,4 13,7 64,7 40,5
0,7 4,5 18,5 24,0 38,9
1,7 10,0 4,8 50,2 38,5
2,6 20,0 21,8 106,0 37,3
1,3 15,0 5,8 96,6 26,5
4,1 137,1 99,0 347,0 37,0
1,6 17,9 20,1 85,6 36,8
6,9 165,4 60,6 745,0 36,3
0,4 2,0 1,4 4,1 35,3
1,3 6,8 8,0 26,8 35,3
1,9 27,1 18,9 42,7 35,0
1,9 13,4 13,2 61,8 26,2
1,4 9,8 12,6 212,0 33,1
0,4 19,5 12,2 105,0 32,7
0,8 6,8 3,2 33,5 32,1
1,8 27,0 13,0 142,0 30,5
0,9 12,4 6,9 96,0 29,8
1,1 17,7 15,0 140,0 25,4
1,9 12,7 11,9 59,3 29,3
-0,9 21,4 1,6 131,0 29,2
1,3 13,5 8,6 70,7 29,2
2,0 13,4 11,5 65,4 29,1
0,6 4,2 1,9 23,1 27,9
0,7 15,5 5.8 80,8 27,2

Izračunajte matrike parnih korelacijskih koeficientov in na njihovi podlagi izberite informativne faktorje za model. Zgradite model samo z informativnimi dejavniki in ocenite njegove parametre.

Izračunajte napake in interval zaupanja napovedi za
stopnja pomembnosti 5 ali 10 % (γ = 0,05; γ = 0,10).

2. Obstajajo podatki o dejavnostih največjih ameriških podjetij v letu 2006.

št. Čisti dobiček, milijarde dolarjev pri Obrat kapitala, milijarde dolarjev. ZDA, X 1 Uporabljeni kapital, milijarde dolarjev. X 2 Število, tisoč ljudi, X 3
6,6 6,9 83,6 222,0
3,0 18.0 6,5 32,0
6,5 107,9 50,4 82,0
3,3 16,7 15,4 45,2
0,1 79,6 29,6 299,3
3,6 16,2 13,3 41,6
1,5 5,9 5,9 17,8
5,5 53,1 27,1 151,0
2,4 18,8 11,2 82,3
3,0 35,3 16,4 103,0
4,2 71,9 32,5 225,4
2,7 93,6 25,4 675,0
1,6 10,0 6,4 43,8
2,4 31,5 12,5 102,3
3,3 36,7 14,3 105,0
1,8 13,8 6,5 49,1
2,4 64,8 22,7 50,4
1,6 30,4 15,8 480,0
1,4 12,1 9,3 71,0
0,9 31,3 18,9 43,0

Izračunajte parametre enačbe linearne multiple regresije s popolnim seznamom faktorjev.

Podajte primerjalno oceno jakosti razmerja med faktorji in rezultatom s pomočjo koeficientov elastičnosti.

Izračunati matrike parnih in parcialnih korelacijskih koeficientov in na njihovi podlagi izbrati informativne faktorje za model. Zgradite model samo z informativnimi dejavniki in ocenite njegove parametre.

Izračunajte predvideno vrednost rezultata, če so predvidene vrednosti faktorjev 80 % njihovih največjih vrednosti.

Izračunajte napake in interval zaupanja napovedi za stopnjo pomembnosti 5 ali 10 % (α = 0,05; α = 0,10).


©2015-2019 stran
Vse pravice pripadajo njihovim avtorjem. To spletno mesto ne zahteva avtorstva, vendar omogoča brezplačno uporabo.
Datum nastanka strani: 2016-02-16

Ideja ekonomskega napovedovanja temelji na predpostavki, da se bo vzorec razvoja, ki je deloval v preteklosti (znotraj niza gospodarskih dinamik), nadaljeval tudi v predvideni prihodnosti. V tem smislu napoved temelji na ekstrapolacije. Ekstrapolacija v prihodnost se imenuje obetavno, in v preteklost - retrospektiva.

Napovedovanje z uporabo metode ekstrapolacije temelji na naslednjih predpostavkah:

  • a) razvoj preučevanega pojava kot celote je opisan z gladko krivuljo;
  • b) splošni trend razvoja pojava v preteklosti in sedanjosti ne kaže na resnejše spremembe v prihodnosti;
  • c) upoštevanje naključnosti nam omogoča oceno verjetnosti odstopanja od naravnega razvoja.

Zanesljivost in točnost napovedi sta odvisni od tega, kako blizu realnosti so se izkazale te predpostavke in kako natančno je bilo mogoče opredeliti vzorec, ugotovljen v preteklosti.

Na podlagi izdelanega modela se izračunajo točkovne in intervalne napovedi.

Točkovno napoved za časovne modele dobimo tako, da v model (enačbo trenda) nadomestimo ustrezno vrednost časovnega faktorja, t.j. t= n + 1, n + 2,..., n + za, kje Za -časovno obdobje.

Natančno ujemanje med dejanskimi podatki in napovednimi točkami, pridobljenimi z ekstrapolacijo, ni verjetno. Pojav ustreznih odstopanj je razložen z naslednjimi razlogi:

  • 1) krivulja, izbrana za napovedovanje, ni edina možna za opis trenda. Možno je izbrati krivuljo, ki daje natančnejše rezultate;
  • 2) napoved je izdelana na podlagi omejenega števila začetnih podatkov. Poleg tega ima vsaka začetna raven tudi naključno komponento; zato bo krivulja, vzdolž katere se izvede ekstrapolacija, vsebovala tudi naključno komponento;
  • 3) trend označuje gibanje povprečne ravni niza dinamike, zato lahko posamezna opazovanja od njega odstopajo. Če so bila takšna odstopanja opažena v preteklosti, jih bomo opazili tudi v prihodnje.

Intervalne napovedi temeljijo na točkovnih napovedih. Interval zaupanja Interval imenujemo tako, da je mogoče z vnaprej izbrano verjetnostjo trditi, da vsebuje vrednost napovedanega indikatorja. Širina intervala je odvisna od kakovosti modela (tj. stopnje njegove bližine dejanskim podatkom), števila opazovanj, obzorja napovedi, stopnje verjetnosti, ki jo izbere uporabnik, in drugih dejavnikov.

Pri izdelavi intervala zaupanja za napoved se izračuna vrednost U(k), ki ima za linearni model obliko

kje o e - standardna napaka (standardni odklon od trendne črte); p-r -število prostostnih stopinj (za linearni model pri = a Q + a ( tštevilo parametrov r = 2).

Koeficient / je tabelarična vrednost Studentove ^-statistike za dano raven pomembnosti in število opazovanj. (Opomba: Vrednost tabele t lahko pridobite s pomočjo Excelove funkcije Studrasbr.)

Za druge modele vrednost shk) se izračuna na podoben način, vendar ima bolj okoren videz. Kot je razvidno iz formule (3.5.21), je količina U(k) je neposredno sorazmerno odvisna od natančnosti modela koeficient zaupanja / , stopnja poglabljanja v prihodnost po Za koraki naprej, tj. v tem trenutku t=p + k, in obratno sorazmerna z obsegom opazovanj.

Interval zaupanja napovedi bo imela naslednje meje:

Če je izdelani model ustrezen, potem lahko z verjetnostjo, ki jo izbere uporabnik, trdimo, da ob ohranjanju obstoječih vzorcev razvoja napovedana vrednost spada v interval, ki ga tvorita zgornja in spodnja meja.

Po pridobitvi ocen napovedi je treba zagotoviti, da so razumne in skladne z ocenami, pridobljenimi na druge načine.

Primer 3.5.4. Finančni direktor Vesta JSC razmišlja o izvedljivosti mesečnega financiranja investicijskega projekta z naslednjimi obsegi neto plačil, tisoč rubljev:

  • 1. Določite linearni model odvisnosti obsega plačil od pogojev (časa).
  • 2. Ocenite kakovost (tj. ustreznost in točnost) izdelanega modela na podlagi študije:
    • a) naključnost preostale komponente glede na kriterij "vrhov";
    • b) neodvisnost ravni številnih ostankov glede na ^w-merilo (uporabite ravni kot kritične vrednosti d x= 1,08 in d 2 = 1,36) in glede na prvi avtokorelacijski koeficient, katerega kritična raven je r(1) = 0,36;
    • c) normalnost porazdelitve rezidualne komponente po I^-merilu s kritičnimi ravnmi 2,7-3,7;
    • d) povprečna modulna relativna napaka.
  • 3. Določite višino plačil za naslednje tri mesece (izdelajte točkovne in intervalne napovedi za tri korake naprej (pri stopnji pomembnosti 0,1), dejanske podatke, rezultate izračuna in napovedi prikažete na grafu).

Ocenite izvedljivost financiranja tega projekta, če lahko podjetje v naslednjem četrtletju za te namene nameni le 120 tisoč rubljev.

  • 1. Gradnja modela
  • 1) Ocena parametrov modela z uporabo dodatka Excel Data Analysis. Zgradimo model linearne regresije Y od /. Za izvedbo regresijske analize sledite tem korakom:
    • ? Izberite ukaz Orodja => Analiza podatkov.
    • ? V pogovornem oknu Analiza podatkov izberite orodje Regresija in kliknite V redu.
    • ? V pogovornem oknu Regresija v polje Vnosni interval Y vnesite naslov posameznega obsega celic, ki predstavlja odvisno spremenljivko. V polju Interval vnosa X vnesite naslov obsega, ki vsebuje vrednosti neodvisne spremenljivke t.Če so izbrane tudi glave stolpcev, izberite potrditveno polje Oznake v prvi vrstici.
    • ? Izberite možnosti izpisa (v tem primeru Nov delovni zvezek).
    • ? V polju Razpored izbire potrdite polje.
    • ? V polju Preostalo izberite zahtevana potrditvena polja in kliknite V redu.

Rezultat regresijske analize bo pridobljen v obliki, prikazani na sl. 3.5.11 in 3.5.12.

riž. 3.5.11.

Drugi stolpec na sl. 3.5.11 vsebuje koeficiente regresijske enačbe a 0, a v

Krivulja rasti odvisnosti obsega plačil od pogojev (časa) ima obliko

2) Ocenjevanje parametrov modela “ročno”. V tabeli 3.5.8 prikazuje vmesne izračune parametrov linearnega modela z uporabo formul (3.5.16). Kot rezultat izračunov dobimo enake vrednosti:


riž. 3.5.12.

Tabela 3.5.8

y t

(t-T)(y,-y)

y, =a 0 + a x t

Včasih je koristno preveriti vnesene formule, da preverite izračune. Če želite to narediti, izberite ukaz Orodja => Možnosti in potrdite polje v oknu formule (slika 3.5.13).


riž. 3.5.13.

Po tem bodo izračunane vrednosti na Excelovem listu zamenjane z ustreznimi formulami in funkcijami (tabela 3.5.9).

  • 2. Ocena kakovosti modela
  • 1) Za ocena ustreznosti izdelanih modelov proučujemo lastnosti rezidualne komponente, tj. odstopanja med nivoji, izračunanimi z modelom, in dejanskimi opazovanji (tabela 3.5.10).

pri preverjanje neodvisnosti(odsotnost avtokorelacije) odsotnost sistematične komponente v številnih ostankih se določi na primer z uporabo Durbin-Watsonovega ^w-merila po formuli (3.4.8):

0t-T)(y t -y)

9t= a o + a x t

=$С$18 + $С$16*А2

=(AZ - 14 A$)

=(VZ - $B$14)

=$С$18 + $С$16*AZ

=$С$18 + $С$16*А4

=$С$18 + $С$16*А5

=$С$18 + $С$16*А6

=$С$18 + $С$16*А7

=$С$18 + $С$16*А8

=$С$18 + $С$16*А9

=(A10 - 14 A$)

=(B10 - $B$14)

=$С$18 + $С$16*А10

=$С$18 + $С$16*А11

=(A12 - 14 A$)

=(B12 - $B$14)

=$С$18 + $С$16*А12

=$С$18 + $С$16*А13

POVPREČJE (E2:E13)

številka

opazovanja

Točke

obračanje

e]

(e G e,-) 2

Ker dw" = 1,88 padel v interval od d 2 do 2, potem lahko na podlagi tega kriterija sklepamo, da je lastnost neodvisnosti izpolnjena (glej tabelo 3.4.1). To pomeni, da v dinamičnem nizu ni avtokorelacije, zato je model po tem kriteriju ustrezen.

Preverjanje naključnosti ravni številnih ostankov bo izvedeno po kriteriju prelomnic [gl. formula (3.5.18)]. Število obratnih točk r pri n = 12 je enako 5 (slika 3.5.14):

Neenakost je izpolnjena (5 > 4). Zato je lastnost naključnosti izpolnjena. Model je po tem kriteriju ustrezen.

Skladnost števila ostankov z normalnim zakonom porazdelitve določimo z uporabo kriterija:

kjer je največja raven niza ostankov e max = 4.962, najmanjša raven niza ostankov e min = -5,283 (glej tabelo 3.5.10) in standardni odklon


riž. 3.5.14.

Dobimo

Izračunana vrednost sodi v interval (2,7-3,7), zato je lastnost normalne porazdelitve izpolnjena. Model je po tem kriteriju ustrezen.

Preverjanje enakosti matematičnega pričakovanja ravni niza ostankov na nič. V našem primeru e = 0, zato je izpolnjena hipoteza, da je matematično pričakovanje vrednosti niza ostankov enako nič.

Podatki iz analize številnih ostankov so podani v tabeli. 3.5.11.

2) Za ocene točnosti izračunajmo model povprečna relativna napaka približka E oti (tabela 3.5.12).

Dobimo

Zaključek: - dobra stopnja natančnosti modela.

Preverljivo

premoženje

Rabljeno

statistika

Meja

Zaključek

Naimenov

Pomen

vrh

Neodvisnost

Durbin - Watsonov ^-merilo

dw = 2,12 dw" = 4-2,12 == 1,88

Ustrezno

Nesreča

Merilo

(rotacijski

Ustrezno

Normalnost

/^-merilo

Ustrezno

Povprečje e = 0

/-statistika

Študentski test

Ustrezno

Zaključek: model je statistično ustrezen

Tabela 3.5.12

številka

jaz gledam

Denia

številka

jaz gledam

Denia

3. Izdelava točkovnih in intervalnih napovedi tri korake naprej

Za izračun točkovne napovedi nadomestimo ustrezne faktorske vrednosti v konstruiranem modelu t = n + k:

Za izdelavo intervalne napovedi izračunamo interval zaupanja. Pri stopnji pomembnosti a = 0,1 je verjetnost zaupanja 90 %, Studentov test pri v = p - 2 = 10 je enako 1,812. Širino intervala zaupanja izračunamo s formulo (3.5.21):

kje (lahko se vzame iz protokola regresijske analize), / = 1,812 (tabelarna vrednost se lahko pridobi v Excelu s funkcijo studraspobr), T = 6,5,

(najdemo iz tabele 3.5.8);

Tabela 3.5.13

Napoved

Zgornja meja

Spodnja meja

U( 1) = 6,80

Ш2) = 7,04

Odgovori. Model izgleda kot Y(t)= 38,23 + 1,81/. Zneski plačil bodo 61,77; 63,58; 65,40 tisoč rubljev. Posledično denarna sredstva v višini 120 tisoč rubljev. za financiranje te naložbe


riž. 3.5.15.

Izvedbeni projekt za naslednje tri mesece ne bo zadostoval, zato morate poiskati dodatna sredstva ali ta projekt opustiti.

Vprašanje 4. Intervali zaupanja napovedi. Ocenjevanje ustreznosti in točnosti modelov

Zadnji korak pri uporabi krivulj rasti je ekstrapolacija trenda iz izbrane enačbe. Predvidene vrednosti proučevanega indikatorja se izračunajo tako, da se časovne vrednosti nadomestijo v enačbo krivulje t, ki ustreza vodilnemu obdobju. Napoved, dobljena na ta način, se imenuje točkovna napoved, saj se za vsak trenutek določi samo ena vrednost napovedanega kazalnika.

V praksi je poleg točkovne napovedi zaželeno določiti meje možne spremembe napovedanega indikatorja, določiti "razpon" možnih vrednosti napovedanega indikatorja, ᴛ.ᴇ. izračunajte intervalno napoved.

Neskladje med dejanskimi podatki in točkovno napovedjo, pridobljeno z ekstrapolacijo trenda iz krivulj rasti, je lahko posledica:

1) subjektivna napaka pri izbiri vrste krivulje;

2) napaka pri ocenjevanju parametrov krivulje;

3) napaka, povezana z odstopanjem posameznih opazovanj od trenda, ki označuje določeno povprečno raven serije v vsakem trenutku.

Negotovost, povezana z drugim in tretjim virom, se lahko odraža v intervalu zaupanja napovedi. Interval zaupanja, ki upošteva negotovost, povezano s položajem trenda in možnostjo odstopanja od tega trenda, je opredeljen kot:

, (5.26)

kje n- dolžina časovne vrste;

L- časovno obdobje; - napoved točke v tem trenutku n+L;

t a- pomen t-Študentska statistika;

S str- povprečna kvadratna napaka napovedi.

Predpostavimo, da je za trend značilna ravna črta:

Ker so ocene parametrov določene iz vzorčne populacije, predstavljene s časovno vrsto, vsebujejo napako. Napaka parametra a 0 vodi do navpičnega premika ravne črte, napaka parametra a 1 spreminjanje kota naklona ravne črte glede na os abscise. Upoštevajoč širjenje specifičnih realizacij glede na trendne črte, disperzijo S 2 str se lahko predstavi kot:

, (5.27)

kje: S y 2- varianco odstopanj dejanskih opazovanj od izračunanih;

t l- pretočni čas, za katerega se izvede ekstrapolacija, t l = n + L;

t- serijsko številko stopenj serije, t=1, 2,..., n;

Serijska številka nivoja v sredini vrstice je ;

Potem lahko interval zaupanja predstavimo kot:

. (5.28)

Označimo koren v izrazu (5.28) z TO. Pomen TO odvisno samo od n in L, ᴛ.ᴇ. na dolžino serije in vodilno obdobje. Iz tega razloga je mogoče sestaviti tabele vrednosti TO oz K*= t a K. Potem bo ocena intervala videti takole:

. (5.29)

Izraz, podoben (5.28), lahko dobimo za polinom drugega reda:

(5.30)

. (5.31)

Varianco odstopanj dejanskih opazovanj od izračunanih določimo z izrazom:

, (5.32)

kje: y t- dejanske vrednosti nivojev serije,

Izračunane vrednosti nivojev vrstic,

n- dolžina časovne vrste,

k- število ocenjenih parametrov nivelmanske krivulje.

Vendar je širina intervala zaupanja odvisna od stopnje pomembnosti, vodilnega obdobja, standardnega odklona od trenda in stopnje polinoma. Višja kot je stopnja polinoma, širši je interval zaupanja za isto vrednost S y, saj je varianca enačbe trenda izračunana kot utežena vsota varianc ustreznih parametrov enačbe.

riž. 5.4. Napoved intervalov zaupanja za linearni trend

Na podoben način se določijo intervali zaupanja za napovedi, pridobljene z eksponentno enačbo. Razlika je v tem, da se tako pri izračunu parametrov krivulje kot pri izračunu srednje kvadratne napake ne uporabljajo vrednosti samih ravni časovnih vrst, temveč njihovi logaritmi.

Z uporabo iste sheme se določijo intervali zaupanja za več krivulj, ki imajo asimptote, če je vrednost asimptote znana (na primer za spremenjeno eksponento).

Tabela 5.4 prikazuje vrednosti ZA* odvisno od dolžine časovne serije n in vodilno obdobje L za črto in parabolo. Očitno je, da z večanjem dolžine vrstic ( n) vrednosti ZA* zmanjšati s povečanjem vodilne dobe L vrednosti ZA* povečanje. V tem primeru vpliv vodilne dobe ni enak za različne vrednosti n: daljša kot je serija, manjši je vpliv vodilne dobe L.

Tabela 5.4

Vrednosti K* za oceno intervalov zaupanja napovedi na podlagi linearnega trenda in paraboličnega trenda z verjetnostjo zaupanja 0,9 (7)

Ena od osnovnih nalog, ki se pojavlja pri napovedovanju, je določitev intervalov zaupanja napovedi. Intuitivno je jasno, da mora osnova za izračun zaupanja intervala napovedi temeljiti na merilniku variabilnosti serije. Večja kot je ta variabilnost, širši je interval napovedi. Zato je treba vprašanje intervala zaupanja napovedi začeti z upoštevanjem merilnika variabilnosti. Običajno je tak meter standardni odklon:

kjer so dejanske in izračunane vrednosti serije;

f– število prostostnih stopinj, določeno na podlagi števila opazovanj ( n) in število parametrov, ki jih je treba oceniti.

f = n – z,

kje z– število parametrov, ki jih je treba oceniti.

Na primer za parabolo druge stopnje f = n– 3, tretja stopnja f = n– 4 itd.

Vsoto kvadratov odstopanj od trenda je mogoče razstaviti na naslednji način:

Zadnji izraz je mogoče poenostaviti. Predpostavimo, da je izhodišče na sredini vrstice, nato , in parametri A in b bo enako:

Po transformacijah dobimo:

Razlika prvih dveh členov na desni strani je enaka vsoti kvadratov odstopanj od aritmetične sredine, ᴛ.ᴇ. .

torej

Zadnji izraz kaže, da je vsota kvadratov odstopanj od trendnih črt manjša kot od aritmetične sredine.

Vsota kvadratov odstopanj od trendnih črt, ᴛ.ᴇ. in standardni odklon od trenda Sy je osnova za določanje srednje kvadratne napake parametrov.

Preden nadaljujete z določanjem intervala zaupanja napovedi, je treba narediti opozorilo. Dejstvo je, da predpostavke o normalnosti porazdelitve odstopanj okoli regresijske premice pri analizi nizov ni mogoče niti potrditi niti preveriti. Razprave v tridesetih in štiridesetih letih 20. stoletja so osvetlile težave, povezane s tem problemom. Posledično ni bil nikoli najden temeljni nov pristop. Vsi predlogi so tako ali drugače povezani z določitvijo intervala zaupanja na podlagi ocene standardnega odklona članov serije.

Parametri, pridobljeni med ocenjevanjem, niso brez napak. Izračunane vrednosti nosijo breme negotovosti, povezane z napakami v vrednostih parametrov.

Na splošno je interval zaupanja napovedi opredeljen kot

kjer je povprečna kvadratna napaka;

Ocenjena vrednost y t;

Pomen t- Študentov t-test.

V primeru t = I + L, potem bo slednji določil vrednost intervala zaupanja na L enote časa.

Interval zaupanja napovedi mora upoštevati ne samo negotovost, ampak tudi možnost odstopanja, ᴛ.ᴇ. obseg variacije. Če povprečno kvadratno napako označimo kot S p, bo interval zaupanja napovedi:

Intervali zaupanja napovedi - pojem in vrste. Razvrstitev in značilnosti kategorije "Intervali zaupanja napovedi" 2017, 2018.

Najnovejši materiali v razdelku:

Prenesite predstavitev o vseruskem dnevu knjižnice
Prenesite predstavitev o vseruskem dnevu knjižnice

Skrivnostno knjižnico katerega ruskega monarha še iščejo v skrivnostnih kremeljskih ječah? a) Ivan Grozni b) Peter I c) Boris...

Lekcija o svetu okoli nas na temo:
Lekcija o svetu okoli nas na temo: "Ko postanemo odrasli" (1. razred)

Mnogi otroci si zastavljajo vprašanje "Kdaj bomo veliki?" Zdi se, da je odraslo življenje bolj zanimivo in pestro, vendar to ni povsem ...

Deshkovsky A., Koifman Yu.G.  Metoda dimenzij pri reševanju problemov.  Mednarodni študentski znanstveni zbornik Osnovni koncepti teorije modeliranja
Deshkovsky A., Koifman Yu.G. Metoda dimenzij pri reševanju problemov. Mednarodni študentski znanstveni zbornik Osnovni koncepti teorije modeliranja

1 Članek obravnava teorijo dimenzionalne metode in uporabo te metode v fiziki. Pojasnjena je definicija dimenzionalne metode. Na seznamu ...