Binomska porazdelitev in njene značilnosti. Binomska porazdelitev

Binomska porazdelitev- ena najpomembnejših verjetnostnih porazdelitev diskretnega spreminjanja naključna spremenljivka. Binomska porazdelitev je verjetnostna porazdelitev števila m pojav dogodka A V n medsebojno neodvisna opazovanja. Pogosto dogodek A se imenuje "uspeh" opazovanja, nasprotni dogodek pa se imenuje "neuspeh", vendar je ta oznaka zelo pogojna.

Pogoji binomske porazdelitve:

  • skupaj izvedenih n sojenja, v katerih dogodek A se lahko pojavi ali ne;
  • dogodek A v vsakem testu se lahko pojavi z enako verjetnostjo str;
  • testi so med seboj neodvisni.

Verjetnost, da v n dogodek testiranja A točno bo prišlo m krat, se lahko izračuna z uporabo Bernoullijeve formule:

,

kje str- verjetnost nastanka dogodka A;

q = 1 - str- verjetnost pojava nasprotnega dogodka.

Ugotovimo zakaj je binomska porazdelitev povezana z Bernoullijevo formulo na zgoraj opisan način? . Dogodek - število uspehov pri n testi so razdeljeni na več možnosti, pri vsaki od katerih je dosežen uspeh m testi in neuspeh - v n - m testi. Razmislimo o eni od teh možnosti - B1 . S pravilom za seštevanje verjetnosti pomnožimo verjetnosti nasprotnih dogodkov:

,

in če označimo q = 1 - str, To

.

Katero koli drugo možnost, pri kateri m uspeh in n - m neuspehi. Število takih možnosti je enako številu načinov, na katere lahko n test dobiti m uspeh.

Vsota vseh verjetnosti mštevilo dogodkov A(številke od 0 do n) je enako ena:

kjer vsak člen predstavlja člen v Newtonovem binomu. Zato se obravnavana porazdelitev imenuje binomska porazdelitev.

V praksi je pogosto treba izračunati verjetnosti "ne več kot m uspeh v n testi" ali "vsaj m uspeh v n testi". Za to se uporabljajo naslednje formule.

Integralna funkcija, tj verjetnost F(m) kaj je notri n opazovalni dogodek A nič več ne bo prišlo m enkrat, se lahko izračuna po formuli:

Po vrsti verjetnost F(≥m) kaj je notri n opazovalni dogodek A ne bo prišlo nič manj m enkrat, se izračuna po formuli:

Včasih je bolj priročno izračunati verjetnost, da n opazovalni dogodek A nič več ne bo prišlo m krat, skozi verjetnost nasprotnega dogodka:

.

Katero formulo uporabiti, je odvisno od tega, kateri od njih ima vsoto manj členov.

Značilnosti binomske porazdelitve se izračunajo z uporabo naslednjih formul .

Pričakovanje: .

Razpršenost: .

Standardni odklon: .

Binomska porazdelitev in izračuni v MS Excelu

Binomska verjetnost p n( m) in vrednosti integralna funkcija F(m) lahko izračunate s funkcijo MS Excel BINOM.DIST. Spodaj je prikazano okno za ustrezen izračun (levi klik za povečavo).


MS Excel zahteva vnos naslednjih podatkov:

  • število uspehov;
  • število testov;
  • verjetnost uspeha;
  • integral - logična vrednost: 0 - če morate izračunati verjetnost p n( m) in 1 - če je verjetnost F(m).

Primer 1. Vodja podjetja je povzel podatke o številu prodanih kamer v zadnjih 100 dneh. V tabeli so povzeti podatki in izračunane verjetnosti, da bo določeno število kamer dnevno prodano.

Dan se konča z dobičkom, če se proda 13 ali več kamer. Verjetnost, da se bo dan končal z dobičkom:

Verjetnost, da bo dan opravljen brez dobička:

Naj bo verjetnost, da se dan dela z dobičkom, konstantna in enaka 0,61, število prodanih kamer na dan pa ni odvisno od dneva. Nato lahko uporabimo binomsko porazdelitev, kjer je dogodek A- dan bo opravljen z dobičkom, - brez dobička.

Verjetnost, da bo vseh 6 dni izpeljanih z dobičkom:

.

Enak rezultat dobimo s funkcijo MS Excel BINOM.DIST (vrednost integralne vrednosti je 0):

p 6 (6 ) = BINOM.DIST(6; 6; 0,61; 0) = 0,052.

Verjetnost, da bodo od 6 dni 4 ali več dni opravljeni z dobičkom:

kje ,

,

S pomočjo MS Excelove funkcije BINOM.DIST izračunamo verjetnost, da od 6 dni ne bomo več kot 3 dni zaključili z dobičkom (vrednost integralne vrednosti je 1):

p 6 (≤3 ) = BINOM.DIST(3; 6; 0,61; 1) = 0,435.

Verjetnost, da bo vseh 6 dni oddelanih z izgubami:

,

Isti indikator lahko izračunamo s pomočjo funkcije MS Excel BINOM.DIST:

p 6 (0 ) = BINOM.DIST(0; 6; 0,61; 0) = 0,0035.

Rešite težavo sami in nato poglejte rešitev

Primer 2. V žari sta 2 beli krogli in 3 črne krogle. Iz žare se vzame kroglica, barva se nastavi in ​​vrne nazaj. Poskus se ponovi 5-krat. Število pojavitev belih kroglic je diskretna naključna spremenljivka X, porazdeljeno po binomskem zakonu. Sestavite zakon porazdelitve naključne spremenljivke. Določite način, matematično pričakovanje in disperzijo.

Nadaljujmo z reševanjem težav skupaj

Primer 3. Iz kurirske službe smo šli na mesta n= 5 kurirjev. Vsak kurir je verjetno str= 0,3, ne glede na druge, zamuja za objekt. Diskretna naključna spremenljivka X- število zamudnih kurirjev. Konstruirajte porazdelitveni niz za to naključno spremenljivko. Poiščite njegovo matematično pričakovanje, varianco, standardni odklon. Poiščite verjetnost, da bosta vsaj dva kurirja zamudila na predmete.

Teorija verjetnosti je nevidno prisotna v naših življenjih. Na to nismo pozorni, vendar ima vsak dogodek v našem življenju takšno ali drugačno verjetnost. Ob upoštevanju ogromno možnosti za razvoj dogodkov, postane nujno, da določimo najverjetnejšo in najmanj verjetne izmed njih. Takšne verjetnostne podatke je najprimerneje analizirati grafično. Pri tem nam lahko pomaga distribucija. Binom je eden najlažjih in najbolj natančnih.

Preden preidemo neposredno na matematiko in teorijo verjetnosti, ugotovimo, kdo je prvi prišel do te vrste porazdelitve in kakšna je zgodovina razvoja matematičnega aparata za ta koncept.

Zgodba

Koncept verjetnosti je znan že od antičnih časov. Vendar stari matematiki temu niso pripisovali velikega pomena in so lahko le postavili temelje teorije, ki je kasneje postala teorija verjetnosti. Ustvarili so nekaj kombinatoričnih metod, ki so zelo pomagale tistim, ki so kasneje ustvarjali in razvijali samo teorijo.

V drugi polovici sedemnajstega stoletja se je začelo oblikovanje osnovnih konceptov in metod teorije verjetnosti. Predstavljene so bile definicije naključnih spremenljivk in metode za izračun verjetnosti enostavnih in nekaterih kompleksnih neodvisnih in odvisnih dogodkov. To zanimanje za naključne spremenljivke in verjetnosti je narekovalo igre na srečo: Vsaka oseba je želela vedeti, kakšne so njene možnosti za zmago v igri.

Naslednja stopnja je bila uporaba metod matematične analize v teoriji verjetnosti. Te naloge so se lotili ugledni matematiki, kot so Laplace, Gauss, Poisson in Bernoulli. Prav oni so napredovali na tem področju matematike nova raven. To je odkril James Bernoulli binomski zakon distribucije. Mimogrede, kot bomo izvedeli kasneje, je bilo na podlagi tega odkritja narejenih še več, kar je omogočilo ustvarjanje zakona normalna porazdelitev in še veliko več.

Zdaj, preden začnemo opisovati binomsko porazdelitev, si bomo nekoliko osvežili spomin na pojme teorije verjetnosti, ki smo jih verjetno že pozabili iz šole.

Osnove teorije verjetnosti

Upoštevali bomo takšne sisteme, zaradi katerih sta možna le dva izida: "uspeh" in "neuspeh". To je enostavno razumeti s primerom: vržemo kovanec v upanju, da bo dobil glavo. Verjetnosti vsakega od možnih dogodkov (padajoče glave - "uspeh", padajoče glave - "neuspeh") so enake 50 odstotkov, če je kovanec popolnoma uravnotežen in ni drugih dejavnikov, ki bi lahko vplivali na poskus.

To je bil najpreprostejši dogodek. Obstajajo pa tudi kompleksni sistemi, v katerem se izvajajo zaporedna dejanja, verjetnosti izidov teh dejanj pa bodo različne. Na primer, razmislite o naslednjem sistemu: v škatli, katere vsebine ne vidimo, je šest popolnoma enakih kroglic, trije pari modrih, rdečih in bele rože. Nekaj ​​žogic moramo dobiti naključno. Skladno s tem, če najprej izvlečemo eno od belih kroglic, bomo bistveno zmanjšali verjetnost, da bomo naslednjo dobili tudi belo kroglico. To se zgodi, ker se spremeni število objektov v sistemu.

V naslednjem razdelku si bomo ogledali bolj zapleteno matematične pojme, kar nas približa temu, kar pomenijo besede "normalna porazdelitev", "binomska porazdelitev" in podobno.

Elementi matematične statistike

V statistiki, ki je eno od področij uporabe teorije verjetnosti, je veliko primerov, kjer podatki za analizo niso podani eksplicitno. Se pravi ne številčno, ampak v obliki delitve po značilnostih, na primer po spolu. Da bi uporabili matematična orodja za takšne podatke in iz dobljenih rezultatov potegnili nekaj zaključkov, je treba izvorne podatke pretvoriti v numerično obliko. Običajno je v ta namen pozitivnemu rezultatu dodeljena vrednost 1, negativnemu rezultatu pa vrednost 0. Tako dobimo statistične podatke, ki jih je mogoče analizirati z matematičnimi metodami.

Naslednji korak pri razumevanju binomske porazdelitve naključne spremenljivke je določitev variance naključne spremenljivke in matematičnega pričakovanja. O tem bomo govorili v naslednjem razdelku.

Pričakovanje

Pravzaprav ni težko razumeti, kaj je matematično pričakovanje. Razmislite o sistemu, v katerem je veliko razne prireditve z različnimi verjetnostmi. Matematično pričakovanje bo količina enaka vsoti produkti vrednosti teh dogodkov (in matematična oblika, o katerih smo govorili v zadnjem razdelku) o verjetnosti njihove izvedbe.

Matematično pričakovanje binomske porazdelitve izračunamo po isti shemi: vzamemo vrednost naključne spremenljivke, jo pomnožimo z verjetnostjo pozitivnega izida in nato dobljene podatke seštejemo za vse spremenljivke. Te podatke je zelo priročno predstaviti grafično - na ta način je razlika med matematičnimi pričakovanji različnih vrednosti bolje zaznavna.

V naslednjem razdelku vam bomo povedali nekaj o drugem konceptu - varianci naključne spremenljivke. Prav tako je tesno povezan s konceptom binomske porazdelitve verjetnosti in je njegova značilnost.

Varianca binomske porazdelitve

Ta vrednost je tesno povezana s prejšnjo in označuje tudi porazdelitev statističnih podatkov. Ona predstavlja srednji kvadrat odstopanja vrednosti od njihovega matematičnega pričakovanja. To pomeni, da je varianca naključne spremenljivke vsota kvadratov razlik med vrednostjo naključne spremenljivke in njenim matematičnim pričakovanjem, pomnožena z verjetnostjo tega dogodka.

Na splošno je to vse, kar moramo vedeti o varianci, da razumemo, kaj je binomska verjetnostna porazdelitev. Zdaj pa preidimo neposredno na našo glavno temo. Namreč, kaj se skriva za tako na videz precej zapleteno besedno zvezo “binomski porazdelitveni zakon”.

Binomska porazdelitev

Najprej ugotovimo, zakaj je ta porazdelitev binomska. Izhaja iz besede "binom". Morda ste že slišali za Newtonov binom – formulo, ki jo lahko uporabite za razširitev vsote poljubnih dveh števil a in b na katero koli nenegativno potenco n.

Kot ste verjetno že uganili, sta Newtonova binomska formula in formula binomske porazdelitve praktično enake formule. Edina izjema je, da ima drugi praktični pomen za določene količine, prvi pa je le splošno matematično orodje, katerega uporaba v praksi je lahko različna.

Porazdelitvene formule

Funkcijo binomske porazdelitve lahko zapišemo kot vsoto naslednjih izrazov:

(n!/(n-k)!k!)*p k *q n-k

Tukaj je n število neodvisnih naključni poskusi, p je število uspešnih izidov, q je število neuspešnih izidov, k je številka eksperimenta (lahko zavzame vrednosti od 0 do n),! - oznaka faktoriala, funkcije števila, katerega vrednost je enaka produktu vseh števil pred njim (na primer za število 4: 4!=1*2*3*4=24).

Poleg tega lahko funkcijo binomske porazdelitve zapišemo kot nepopolno beta funkcijo. Vendar je to že več kompleksna definicija, ki se uporablja samo pri reševanju kompleksnih statističnih problemov.

Binomska porazdelitev, katere primere smo pogledali zgoraj, je ena izmed najbolj enostavne vrste porazdelitve v teoriji verjetnosti. Obstaja tudi normalna porazdelitev, ki je vrsta binoma. Uporablja se najpogosteje in ga je najlažje izračunati. Obstajajo tudi Bernoullijeve porazdelitve, Poissonove porazdelitve in pogojne porazdelitve. Vsi grafično označujejo obsege verjetnosti določenega procesa v različnih pogojih.

V naslednjem razdelku bomo obravnavali vidike, povezane z uporabo tega matematičnega aparata v resnično življenje. Na prvi pogled se seveda zdi, da je to le še ena matematična stvar, ki kot običajno ne najde uporabe v resničnem življenju in je na splošno ne potrebuje nihče razen matematikov samih. Vendar temu še zdaleč ni tako. Konec koncev, vse vrste distribucij in njihovih grafični prikazi so bile ustvarjene izključno za praktične namene, in ne kot muhavost znanstvenikov.

Aplikacija

Seveda največ pomembna aplikacija porazdelitve najdemo v statistiki, ker potrebujejo celovito analizo veliko podatkov. Kot kaže praksa, imajo številni nizi podatkov približno enako porazdelitev vrednosti: kritična območja zelo nizkih in zelo visokih vrednosti praviloma vsebujejo manj elementov od povprečnih vrednosti.

Analiza velikih nizov podatkov ni potrebna samo v statistiki. Nepogrešljiv je na primer v fizikalna kemija. V tej znanosti se uporablja za določanje številnih količin, ki so povezane z naključnimi vibracijami in gibanjem atomov in molekul.

V naslednjem razdelku bomo razumeli, kako pomembna je uporaba tega statistični koncepti, kot binom porazdelitev naključne spremenljivke v vsakdanje življenje zate in zame.

Zakaj potrebujem to?

Mnogi ljudje si to vprašanje zastavljajo, ko gre za matematiko. Mimogrede, matematika se ne imenuje zaman kraljica znanosti. Je osnova fizike, kemije, biologije, ekonomije in v vsaki od teh ved se uporablja tudi neka porazdelitev: ali je to diskretna binomska porazdelitev ali normalna, ni pomembno. In če pobližje pogledamo svet okoli nas, bomo videli, da se matematika uporablja povsod: v vsakdanjem življenju, v službi in celo človeški odnosi mogoče predstaviti v obliki statističnih podatkov in analizirati (to, mimogrede, počnejo tisti, ki delajo v posebne organizacije sodeluje pri zbiranju informacij).

Zdaj pa se pogovorimo o tem, kaj storiti, če morate o tej temi vedeti veliko več, kot smo opisali v tem članku.

Informacije, ki smo jih navedli v tem članku, še zdaleč niso popolne. Glede oblike distribucije je veliko nians. Binomska porazdelitev, kot smo že ugotovili, je ena glavnih vrst, na katerih temelji celota matematična statistika in teorija verjetnosti.

Če vas ta tema začne zanimati ali v zvezi z vašim delom morate vedeti veliko več o tej temi, boste morali preučiti specializirano literaturo. Začeti bi morali z univerzitetnim tečajem matematična analiza in pridite do razdelka o teoriji verjetnosti. Prav bo prišlo tudi poznavanje nizov, saj binomska verjetnostna porazdelitev ni nič drugega kot niz zaporednih členov.

Zaključek

Preden zaključimo članek, bi vam radi povedali še eno zanimivost. Neposredno zadeva temo našega članka in vso matematiko na splošno.

Mnogi ljudje pravijo, da je matematika neuporabna znanost in da jim nič, kar so se učili v šoli, ni koristilo. A znanje ni nikoli odveč in če ti nekaj v življenju ne koristi, pomeni, da se tega enostavno ne spomniš. Če imate znanje, vam lahko pomagajo, če pa ga nimate, potem pomoči od njih ne morete pričakovati.

Tako smo si ogledali koncept binomske porazdelitve in vse z njim povezane definicije ter se pogovarjali o tem, kako jo uporabljamo v naših življenjih.


Seveda je pri izračunu kumulativne porazdelitvene funkcije treba uporabiti omenjeno povezavo med binomsko in beta porazdelitvijo. Ta metoda je očitno boljša od neposrednega seštevanja, če je n > 10.

V klasičnih učbenikih o statistiki se za pridobitev vrednosti binomske porazdelitve pogosto priporoča uporaba formul, ki temeljijo na mejnih izrekih (kot je formula Moivre-Laplace). Opozoriti je treba, da s čisto računalniškega vidika vrednost teh izrekov je blizu ničle, še posebej zdaj, ko ima skoraj vsaka miza močan računalnik. Glavna pomanjkljivost zgornjih približkov je njihova popolnoma nezadostna natančnost za vrednosti n, značilne za večino aplikacij. Nič manjša pomanjkljivost je odsotnost kakršnih koli jasnih priporočil o uporabnosti tega ali onega približka (standardna besedila zagotavljajo le asimptotične formulacije; ne spremljajo jih ocene točnosti in so zato malo uporabna). Rekel bi, da sta obe formuli primerni le za n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Tu ne razmišljam o problemu iskanja kvantilov: za diskretne porazdelitve je trivialen, v tistih problemih, kjer se pojavijo takšne porazdelitve, pa praviloma ni pomemben. Če so kvantili še vedno potrebni, priporočam, da problem preoblikujete tako, da delate z vrednostmi p (opazovane pomembnosti). Tukaj je primer: pri izvajanju nekaterih izčrpnih iskalnih algoritmov je treba na vsakem koraku preizkusiti statistično hipotezo o binomski naključni spremenljivki. Glede na klasičen pristop Na vsakem koraku morate izračunati kriterijsko statistiko in njeno vrednost primerjati z mejo kritične množice. Ker pa je algoritem izčrpen, je treba vsakič na novo določiti mejo kritične množice (navsezadnje se velikost vzorca spreminja iz koraka v korak), kar neproduktivno povečuje časovne stroške. Sodoben pristop priporoča izračun opazovane pomembnosti in njeno primerjavo z verjetnost zaupanja, prihranek pri iskanju kvantilov.

Zato v spodnjih kodah ni izračuna inverzne funkcije, temveč je podana funkcija rev_binomialDF, ki izračuna verjetnost p uspeha v posameznem poskusu glede na število n poskusov, število m uspehov v njih in vrednost y verjetnosti doseganja teh m uspehov. To uporablja prej omenjeno povezavo med binomsko in beta porazdelitvijo.

Pravzaprav vam ta funkcija omogoča, da pridobite meje intervalov zaupanja. Recimo, da imamo v n binomskih poskusih m uspehov. Kot je znano, je leva meja dvostranska interval zaupanja za parameter p s stopnjo zaupanja je enak 0, če je m = 0, in za je rešitev enačbe . Podobno je desna meja 1, če je m = n, in za je rešitev enačbe . Iz tega sledi, da moramo za iskanje leve meje rešiti relativno enačbo , in najti pravo – enačbo . Rešijo se v funkcijah binom_leftCI in binom_rightCI, ki vrneta zgornjo oziroma spodnjo mejo dvostranskega intervala zaupanja.

Rad bi opozoril, da če ne potrebujete popolnoma neverjetne natančnosti, lahko za dovolj velik n uporabite naslednji približek [B.L. van der Waerden, Matematična statistika. M: IL, 1960, pogl. 2, razdelek 7]: , kjer je g kvantil normalne porazdelitve. Vrednost tega približka je v tem, da obstajajo zelo preprosti približki, ki vam omogočajo izračun kvantilov normalne porazdelitve (glejte besedilo o izračunu normalne porazdelitve in ustrezen del tega priročnika). V moji praksi (predvsem pri n > 100) je ta aproksimacija dala približno 3-4 števke, kar je praviloma povsem dovolj.

Za izračun z uporabo naslednjih kod boste potrebovali datoteki betaDF.h, betaDF.cpp (glejte razdelek o distribuciji beta), kot tudi logGamma.h, logGamma.cpp (glejte Dodatek A). Ogledate si lahko tudi primer uporabe funkcij.

Datoteka binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" dvojni binomDF(dvojni poskusi, dvojni uspehi, dvojni p); /* * Naj obstajajo "poskusi" neodvisnih opazovanj * z verjetnostjo "p" uspeha pri vsakem.

* Izračunajte verjetnost B(uspehi|poskusi,p), da je število * uspehov med 0 in "uspehi" (vključno).

/************************************************ * *********/ /* Binomska porazdelitev */ /******************************** * *************************/ #vključi #vključi #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Naj obstaja "n" neodvisnih opazovanj * z verjetnostjo "p" uspeha pri vsakem.<= p <= 1. */ { assert((n >* Verjetnost B(m|n,p) je izračunana, da je število uspehov * med 0 in "m" (vključno), tj.<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >* vsota binomskih verjetnosti od 0 do m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Izračuni ne pomenijo neposrednega seštevanja - * se uporablja naslednji odnos do centralne beta porazdelitve: * * B(m|n,p) = Beta(1-p|n-m,m+1).<= n) && (y >* * Argumenti morajo biti pozitivni, z 0<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (p >= 0) && (str<= n) && (y >= n) vrni 1;< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (p >= 0) && (str<= n) && (y >= n) vrni 1;< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/

drugače vrni BetaDF(n-m, m+1).vrednost(1-p); )/* binomialDF */ VNOS double rev_binomialDF(double n, double m, double y) /* * Naj se pojavi verjetnost y vsaj m uspehov * v n poskusih Bernoullijeve sheme. Funkcija poišče verjetnost p* uspeha v posameznem poskusu. * * Pri izračunih je uporabljena naslednja relacija * * 1 - p = rev_Beta(y|n-m,m+1).. */ ( assert((n > 0) && (m >= 0) && (m= 0) && (y 0) && (m >= 0) && (m= 0,5) && (y

V tej in naslednjih nekaj objavah si bomo ogledali matematične modele

naključni dogodki Matematični model

  • - To n matematični izraz
  • , ki predstavlja naključno spremenljivko. Za diskretne naključne spremenljivke je ta matematični izraz znan kot porazdelitvena funkcija.
  • Če vam problem omogoča eksplicitno pisanje matematičnega izraza, ki predstavlja naključno spremenljivko, lahko izračunate natančno verjetnost katere koli njene vrednosti. V tem primeru lahko izračunate in navedete vse vrednosti distribucijske funkcije. Različne porazdelitve naključnih spremenljivk se srečujejo v poslovnih, socioloških in medicinskih aplikacijah. Ena najbolj uporabnih porazdelitev je binomska. Binomska porazdelitev uporablja za simulacijo situacij, za katere so značilne naslednje značilnosti. Vzorec je sestavljen iz določenega števila elementov.
  • Izid (tj. uspeh ali neuspeh) katerega koli poskusa ni odvisen od izida drugega poskusa. Da bi zagotovili neodvisnost rezultatov, so vzorčni elementi običajno pridobljeni z uporabo dveh različnih metod. Vsak vzorčni element naključno je izvlečeno iz neskončnega prebivalstvo brez povratka ali iz končne populacije z povratkom.

Prenesite opombo v ali obliki, primeri v obliki

Binomska porazdelitev se uporablja za oceno števila uspehov v vzorcu, sestavljenem iz n opazovanja. Vzemimo za primer naročanje. Za oddajo naročila lahko stranke Saxon Company uporabijo interaktivni elektronski obrazec in ga pošljejo podjetju. Informacijski sistem nato preveri napake, nepopolne ali nepravilne podatke v naročilih. Poljubno naročilo vprašljivo, je označeno in vključeno v dnevno poročilo o izjemah. Podatki, ki jih podjetje zbira, kažejo, da je verjetnost napak pri naročilih 0,1. Podjetje bi želelo vedeti, kakšna je verjetnost, da v danem vzorcu najde določeno število napačnih naročil. Denimo, da so stranke opravile štiri elektronske obrazce. Kakšna je verjetnost, da bodo vsa naročila brez napak? Kako izračunati to verjetnost? Pod uspehom bomo razumeli napako pri izpolnjevanju obrazca, vse ostale izide pa neuspešne. Spomnimo se, da nas zanima število napačnih naročil v danem vzorcu.

Kakšne rezultate lahko opazimo? Če je vzorec sestavljen iz štirih naročil, so lahko eden, dva, tri ali vsi štirje nepravilni, vsi pa so lahko pravilni. Ali lahko naključna spremenljivka, ki opisuje število nepravilno izpolnjenih obrazcev, zavzame kakšno drugo vrednost? To ni mogoče, ker število nepravilnih obrazcev ne sme preseči velikosti vzorca n ali biti negativen. Tako naključna spremenljivka, ki upošteva zakon binomske porazdelitve, ima vrednosti od 0 do n.

Predpostavimo, da so v vzorcu štirih naročil opaženi naslednji rezultati:

Kakšna je verjetnost, da najdemo tri napačna naročila v vzorcu štirih naročil v navedenem vrstnem redu? Ker je preliminarna raziskava pokazala, da je verjetnost napake pri izpolnjevanju obrazca 0,10, se verjetnosti zgornjih izidov izračunajo na naslednji način:

Ker izidi niso odvisni drug od drugega, je verjetnost navedenega zaporedja izidov enaka: p*p*(1–p)*p = 0,1*0,1*0,9*0,1 = 0,0009. Če morate izračunati število izbir X n elementov, morate uporabiti formulo kombinacije (1):

kje n! = n * (n –1) * (n – 2) * … * 2 * 1 - faktoriel števila n, in 0! = 1 in 1! = 1 po definiciji.

Ta izraz se pogosto imenuje . Če je torej n = 4 in X = 3, je število zaporedij, sestavljenih iz treh elementov, ekstrahiranih iz velikosti vzorca 4, določeno z naslednjo formulo:

Zato se verjetnost odkrivanja treh napačnih naročil izračuna na naslednji način:

(Število možnih zaporedij) *
(verjetnost določenega zaporedja) = 4 * 0,0009 = 0,0036

Podobno lahko izračunate verjetnost, da bo med štirimi naročili eno ali dve napačni, pa tudi verjetnost, da so vsa naročila napačna ali vsa pravilna. Vendar z naraščajočo velikostjo vzorca n določanje verjetnosti določenega zaporedja izidov postane težje. V tem primeru primerno matematični model, ki opisuje binomsko porazdelitev števila izbir X predmetov iz izbora, ki vsebuje n elementi.

Binomska porazdelitev

kje P(X)- verjetnost X uspeh za določeno velikost vzorca n in verjetnost uspeha Binomska porazdelitev, X = 0, 1, … n.

Upoštevajte, da je formula (2) formalizacija intuitivnih zaključkov. Naključna spremenljivka X, ki upošteva binomsko porazdelitev, lahko sprejme poljubno celo število v območju od 0 do n. delo Binomska porazdelitevX(1 – p)nX predstavlja verjetnost določenega zaporedja, sestavljenega iz X uspeh v velikosti vzorca, ki je enak n. Velikost določa količino možne kombinacije, sestavljen iz X uspeh v n testi. Zato za določeno število testov n in verjetnost uspeha Binomska porazdelitev verjetnost zaporedja, sestavljenega iz X uspeh, enak

P(X) = (število možnih zaporedij) * (verjetnost določenega zaporedja) =

Oglejmo si primere, ki ponazarjajo uporabo formule (2).

1. Predpostavimo, da je verjetnost nepravilnega izpolnjevanja obrazca 0,1. Kakšna je verjetnost, da bodo med štirimi izpolnjenimi obrazci trije nepravilni? S formulo (2) ugotovimo, da je verjetnost odkrivanja treh napačnih naročil v vzorcu, sestavljenem iz štirih naročil, enaka

2. Predpostavimo, da je verjetnost nepravilnega izpolnjevanja obrazca 0,1. Kolikšna je verjetnost, da bodo med štirimi izpolnjenimi obrazci vsaj trije nepravilni? Kot je prikazano v prejšnjem primeru, je verjetnost, da bodo med štirimi izpolnjenimi obrazci trije nepravilni, 0,0036. Za izračun verjetnosti, da bodo med štirimi izpolnjenimi obrazci vsaj trije napačni, morate sešteti verjetnost, da bodo med štirimi izpolnjenimi obrazci trije napačni, in verjetnost, da bodo med štirimi izpolnjenimi obrazci vsi napačni. Verjetnost drugega dogodka je

Tako je verjetnost, da bodo med štirimi izpolnjenimi obrazci vsaj trije nepravilni, enaka

P(X > 3) = P(X = 3) + P(X = 4) = 0,0036 + 0,0001 = 0,0037

3. Predpostavimo, da je verjetnost nepravilnega izpolnjevanja obrazca 0,1. Kolikšna je verjetnost, da bodo od štirih izpolnjenih obrazcev manj kot trije nepravilni? Verjetnost tega dogodka

P(X< 3) = P(X = 0) + P(X = 1) + P(X = 2)

Z uporabo formule (2) izračunamo vsako od teh verjetnosti:

Zato je P(X< 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Verjetnost P(X< 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х>3. Potem P(X< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

Ko se velikost vzorca poveča n izračuni, podobni tistim v primeru 3, postanejo težavni. Da bi se izognili tem zapletom, je veliko binomskih verjetnosti tabelarnih vnaprej. Nekatere od teh verjetnosti so prikazane na sl. 1. Na primer, da bi dobili verjetnost, da X= 2 at n= 4 in str= 0,1, morate iz tabele izluščiti številko na presečišču črte X= 2 in stolpce Binomska porazdelitev = 0,1.

riž. 1. Binomska verjetnost pri n = 4, X= 2 in Binomska porazdelitev = 0,1

Binomsko porazdelitev je mogoče izračunati z uporabo Excelove funkcije=BINOM.DIST() (slika 2), ki ima 4 parametre: število uspehov – X, število testov (ali velikost vzorca) – n, verjetnost uspeha – Binomska porazdelitev, parameter integral, ki ima vrednost TRUE (v tem primeru se izračuna verjetnost nič manj X dogodkov) ali FALSE (v tem primeru se izračuna verjetnost točno X dogodki).

riž. 2. Parametri funkcije =BINOM.DIST()

Za zgornje tri primere so izračuni prikazani na sl. 3 (glej tudi datoteko Excel). Vsak stolpec vsebuje eno formulo. Številke prikazujejo odgovore na primere ustreznega števila).

riž. 3. Izračun binomska porazdelitev v Excelu za n= 4 in str = 0,1

Lastnosti binomske porazdelitve

Binomska porazdelitev je odvisna od parametrov n in Binomska porazdelitev. Binomska porazdelitev je lahko simetrična ali asimetrična. Če je p = 0,05, je binomska porazdelitev simetrična ne glede na vrednost parametra n. Če pa je p ≠ 0,05, postane porazdelitev poševna. Bližje kot je vrednost parametra Binomska porazdelitev do 0,05 in čim večja je velikost vzorca n, manj izrazita je asimetrija porazdelitve. Tako je porazdelitev števila nepravilno izpolnjenih obrazcev nagnjena v desno, ker str= 0,1 (slika 4).

riž. 4. Histogram binomske porazdelitve pri n= 4 in str = 0,1

Pričakovanje binomske porazdelitve enak zmnožku velikosti vzorca n o verjetnosti uspeha Binomska porazdelitev:

(3) M = E(X) =n.p.

V povprečju je lahko pri dovolj dolgem nizu testov v vzorcu, sestavljenem iz štirih nalogov, p = E(X) = 4 x 0,1 = 0,4 napačno izpolnjenih obrazcev.

Standardni odklon binomske porazdelitve

na primer standardni odklonštevilo nepravilno izpolnjenih obrazcev v računovodstvu informacijski sistem je enako:

Uporabljeno je gradivo iz knjige Levin et al. – M.: Williams, 2004. – str. 307–313

7. poglavje

Specifični zakoni porazdelitve slučajnih spremenljivk

Vrste zakonov porazdelitve diskretnih naključnih spremenljivk

Naj diskretna naključna spremenljivka prevzame vrednosti X 1 , X 2 , …, x n,…. Verjetnosti teh vrednosti je mogoče izračunati iz razne formule, na primer z uporabo osnovnih izrekov teorije verjetnosti, Bernoullijeve formule ali kakšnih drugih formul. Za nekatere od teh formul ima distribucijski zakon svoje ime.

Najpogostejši zakoni porazdelitve diskretne naključne spremenljivke so binomski, geometrijski, hipergeometrični in Poissonov porazdelitveni zakon.

Binomski zakon porazdelitve

Naj se proizvaja n neodvisni poskusi, v vsakem od katerih se dogodek lahko pojavi ali ne A. Verjetnost, da se ta dogodek zgodi v vsakem posameznem poskusu, je konstantna, ni odvisna od številke poskusa in je enaka Binomska porazdelitev=R(A). Od tod verjetnost, da se dogodek ne zgodi A v vsakem testu tudi stalen in enak q=1–Binomska porazdelitev. Upoštevajte naključno spremenljivko X enako številu ponovitev dogodka A V n testi. Očitno sta vrednosti te količine enaki

X 1 =0 – dogodek A V n testi se niso pojavili;

X 2 =1 – dogodek A V n pojavil enkrat v poskusih;

X 3 =2 – dogodek A V n testi so se pojavili dvakrat;

…………………………………………………………..

x n +1 = n- dogodek A V n vse se je pokazalo med testi n enkrat.

Verjetnosti teh vrednosti je mogoče izračunati z Bernoullijevo formulo (4.1):

kje Za=0, 1, 2, …,n .

Binomski zakon porazdelitve X, enako številu uspeh v n Bernoullijevi testi z verjetnostjo uspeha Binomska porazdelitev.

Torej ima diskretna naključna spremenljivka binomsko porazdelitev (ali je porazdeljena po binomskem zakonu), če so njene možne vrednosti 0, 1, 2, ..., n, ustrezne verjetnosti pa se izračunajo z uporabo formule (7.1).

Binomska porazdelitev je odvisna od dveh parametri Binomska porazdelitev in n.

Porazdelitvena serija naključne spremenljivke, porazdeljene po binomskem zakonu, ima obliko:

X k n
R

Primer 7.1 . V tarčo se izstrelijo trije neodvisni streli. Verjetnost zadetka vsakega strela je 0,4. Naključna spremenljivka X– število zadetkov v tarčo. Sestavite njegovo distribucijsko serijo.

rešitev. Možne vrednosti naključne spremenljivke X so X 1 =0; X 2 =1; X 3 =2; X 4 =3. Poiščimo ustrezne verjetnosti z uporabo Bernoullijeve formule. Ni težko pokazati, da je uporaba te formule tukaj povsem upravičena. Upoštevajte, da bo verjetnost, da ne boste zadeli tarče z enim strelom, enaka 1-0,4=0,6. Dobimo

Distribucijska serija ima naslednjo obliko:

X
R 0,216 0,432 0,288 0,064

Preprosto je preveriti, da je vsota vseh verjetnosti enaka 1. Naključna spremenljivka sama X porazdeljena po binomskem zakonu. ■

Poiščimo matematično pričakovanje in varianco naključne spremenljivke, porazdeljene po binomskem zakonu.

Pri reševanju primera 6.5 se je pokazalo, da je matematično pričakovanje števila ponovitev dogodka A V n neodvisni testi, če je verjetnost pojava A v vsakem testu stalna in enaka Binomska porazdelitev, enako n· Binomska porazdelitev

Ta primer je uporabil naključno spremenljivko, porazdeljeno v skladu z binomskim zakonom. Zato je rešitev primera 6.5 v bistvu dokaz naslednjega izreka.

Izrek 7.1. Matematično pričakovanje diskretne naključne spremenljivke, porazdeljene po binomskem zakonu, je enako zmnožku števila poskusov in verjetnosti "uspeha", tj. M(X)=n· r.

Izrek 7.2. Varianca diskretne naključne spremenljivke, porazdeljene po binomskem zakonu, je enaka produktu števila poskusov z verjetnostjo "uspeha" in verjetnostjo "neuspeha", tj. D(X)=nрq.

Asimetrija in kurtoza naključne spremenljivke, porazdeljene po binomskem zakonu, je določena s formulami

Te formule je mogoče dobiti z uporabo koncepta začetnih in osrednjih trenutkov.

Zakon binomske porazdelitve je osnova mnogih situacij v resničnem življenju. pri velike vrednosti n Binomsko porazdelitev je mogoče približati z uporabo drugih porazdelitev, zlasti Poissonove porazdelitve.

Poissonova porazdelitev

Naj bo n Bernoullijevi testi s številom testov n dovolj velik. Prej je bilo dokazano, da v tem primeru (če je poleg tega verjetnost Binomska porazdelitev dogodkov A zelo majhna), da ugotovimo verjetnost, da dogodek A pojavijo T Ko ste v testih, lahko uporabite Poissonovo formulo (4.9). Če je naključna spremenljivka X pomeni število ponovitev dogodka A V n Bernoullijevi testi, potem je verjetnost, da X bo prevzel vrednost k lahko izračunate s formulo

, (7.2)

kje λ = št.

Poissonov zakon porazdelitve imenujemo porazdelitev diskretne naključne spremenljivke X, za katere so možne vrednosti nenegativna cela števila, in verjetnosti r t te vrednosti najdemo s formulo (7.2).

Magnituda λ = št klical parameter Poissonove porazdelitve.

Naključna spremenljivka, porazdeljena po Poissonovem zakonu, lahko sprejme neskončen niz vrednosti. Ker je za to porazdelitev verjetnost Binomska porazdelitev Pojavnost dogodka v vsakem poskusu je majhna, zato se ta porazdelitev včasih imenuje zakon redkih dogodkov.

Porazdelitvena serija naključne spremenljivke, porazdeljene po Poissonovem zakonu, ima obliko

X T
R

Preprosto je preveriti, da je vsota verjetnosti druge vrstice enaka 1. Če želite to narediti, se morate spomniti, da je funkcijo mogoče razširiti v Maclaurinovo vrsto, ki konvergira za katero koli X. V tem primeru imamo

. (7.3)

Kot smo že omenili, Poissonov zakon nadomesti binomski zakon v nekaterih omejitvenih primerih. Primer je naključna spremenljivka X, katerih vrednosti so enake številu okvar v določenem časovnem obdobju med večkratno uporabo tehnične naprave. Predpostavlja se, da gre za zelo zanesljivo napravo, tj. Verjetnost neuspeha pri eni aplikaciji je zelo majhna.

Poleg takih omejitvenih primerov v praksi obstajajo naključne spremenljivke, porazdeljene po Poissonovem zakonu, ki niso povezane z binomsko porazdelitvijo. Na primer, Poissonova porazdelitev se pogosto uporablja pri obravnavanju števila dogodkov, ki se zgodijo v določenem časovnem obdobju (število prejetih klicev na telefonski centrali v eni uri, število avtomobilov, ki prispejo v avtopralnico v enem dnevu, število postankov stroja na teden itd.). Vsi ti dogodki naj bi tvorili tako imenovani tok dogodkov, ki je eden od osnovnih konceptov teorije čakalnih vrst. Parameter λ označuje povprečno intenzivnost toka dogodkov.

Najnovejši materiali v razdelku:

Izkušnje referenčnih in bibliografskih storitev za bralce otrok v knjižnicah Centralne knjižnice Ust-Abakan Struktura Centralne otroške knjižnice
Izkušnje referenčnih in bibliografskih storitev za bralce otrok v knjižnicah Centralne knjižnice Ust-Abakan Struktura Centralne otroške knjižnice

Predstavljamo vam brezplačno vzorčno poročilo za diplomo iz prava na temo "Katalogi kot sredstvo za uvajanje otrok v branje v...

Opis umetnega ekosistema Ekosistem kmetije
Opis umetnega ekosistema Ekosistem kmetije

Ekosistem je skupek živih organizmov, ki sobivajo v določenem habitatu in medsebojno delujejo z izmenjavo snovi in...

Značilnosti Khlestakova iz
Značilnosti Khlestakova iz "generalnega inšpektorja" Videz Khlestakova z mize generalnega inšpektorja

Khlestakov je eden najbolj presenetljivih likov v komediji "Generalni inšpektor". On je krivec za vse dogajanje, o katerem pisatelj poroča takoj v...