Razlaga verjetnostne formule in njih samih. Teorija verjetnosti

Matematika za programerje: Teorija verjetnosti

Ivan Kamišan

Nekateri programerji po delu na področju razvoja običajnih komercialnih aplikacij razmišljajo o tem, da bi obvladali strojno učenje in postali podatkovni analitik. Pogosto ne razumejo, zakaj določene metode delujejo, in večina metod strojnega učenja se zdi kot čarovnija. Pravzaprav strojno učenje temelji na matematični statistiki, ta pa na teoriji verjetnosti. Zato bomo v tem članku pozornost namenili osnovnim konceptom teorije verjetnosti: dotaknili se bomo definicij verjetnosti, porazdelitve in analizirali nekaj preprostih primerov.

Morda veste, da je teorija verjetnosti konvencionalno razdeljena na 2 dela. Diskretna teorija verjetnosti preučuje pojave, ki jih je mogoče opisati s porazdelitvijo s končnim (ali štetim) številom možnih možnosti obnašanja (metanje kock, kovancev). Kontinuirana teorija verjetnosti preučuje pojave, porazdeljene po nekem gostem nizu, na primer na segmentu ali v krogu.

Predmet teorije verjetnosti lahko obravnavamo na preprostem primeru. Predstavljajte si sebe kot razvijalca streljačin. Sestavni del razvoja iger tega žanra je mehanika streljanja. Jasno je, da bo strelec, v katerem vse orožje strelja popolnoma natančno, za igralce malo zanimiv. Zato je nujno, da svojemu orožju dodate širjenje. Toda preprosto naključno določanje udarnih točk orožja ne bo omogočilo natančnega prilagajanja, zato bo prilagajanje ravnovesja igre težko. Hkrati je mogoče z uporabo naključnih spremenljivk in njihovih porazdelitev analizirati, kako se bo orožje obneslo z določenim razmakom, in pomagati pri potrebnih prilagoditvah.

Prostor elementarnih rezultatov

Recimo, da lahko iz nekega naključnega eksperimenta, ki ga lahko večkrat ponovimo (na primer met kovanca), izluščimo nekaj formaliziranih informacij (prišlo je do glav ali repov). Te informacije imenujemo elementarni izid in koristno je upoštevati nabor vseh osnovnih izidov, ki jih pogosto označujemo s črko Ω (Omega).

Struktura tega prostora je v celoti odvisna od narave eksperimenta. Na primer, če upoštevamo streljanje na dovolj veliko krožno tarčo, bo prostor elementarnih izidov krog, zaradi priročnosti postavljen s središčem na nič, izid pa bo točka v tem krogu.

Poleg tega se upoštevajo množice elementarnih izidov - dogodkov (npr. zadetek prve desetke je koncentrični krog majhnega radija s tarčo). V diskretnem primeru je vse precej preprosto: v končnem času lahko dobimo kateri koli dogodek, vključno z ali brez elementarnih izidov. V neprekinjenem primeru je vse veliko bolj zapleteno: za preučitev potrebujemo dokaj dobro družino množic, imenovano algebra po analogiji s preprostimi realnimi števili, ki jih je mogoče seštevati, odštevati, deliti in množiti. Množice v algebri se lahko sekajo in združujejo, rezultat operacije pa bo v algebri. To je zelo pomembna lastnost za matematiko, ki je v ozadju vseh teh konceptov. Minimalna družina je sestavljena samo iz dveh množic - prazne množice in prostora elementarnih rezultatov.

Mera in verjetnost

Verjetnost je način sklepanja o obnašanju zelo zapletenih predmetov, ne da bi razumeli, kako delujejo. Tako je verjetnost opredeljena kot funkcija dogodka (iz tiste zelo dobre družine nizov), ki vrne število - nekaj značilnosti, ki kažejo, kako pogosto se lahko tak dogodek zgodi v resnici. Zagotovo so se matematiki strinjali, da bi moralo biti to število med nič in ena. Poleg tega ima ta funkcija zahteve: verjetnost nemogočega dogodka je enaka nič, verjetnost celotnega niza izidov je enota in verjetnost združevanja dveh neodvisnih dogodkov (disjunktnih nizov) je enaka vsoti verjetnosti. Drugo ime za verjetnost je verjetnostna mera. Najpogosteje se uporablja Lebesgueova mera, ki posplošuje koncepte dolžine, ploščine, prostornine na poljubne dimenzije (n-dimenzionalni volumen) in je tako uporabna za širok razred množic.

Skupaj se imenuje zbirka niza osnovnih izidov, družine nizov in verjetnostne mere verjetnostni prostor. Razmislimo, kako lahko sestavimo verjetnostni prostor za primer streljanja v tarčo.

Razmislite o streljanju na veliko okroglo tarčo polmera R, ki je ni mogoče zgrešiti. Z nizom elementarnih dogodkov postavimo krog s središčem v izhodišču koordinat polmera R. Ker bomo za opis verjetnosti dogodka uporabili površino (Lebesguevo mero za dvodimenzionalne množice), bomo uporabili družino merljivih (za katere ta mera obstaja) množic.

Opomba Pravzaprav je to tehnična točka in pri preprostih problemih postopek določanja mere in družine množic ne igra posebne vloge. Vendar je treba razumeti, da ta dva predmeta obstajata, saj se v mnogih knjigah o teoriji verjetnosti teoremi začnejo z besedami: " Naj bo (Ω,Σ,P) verjetnostni prostor ...».

Kot je navedeno zgoraj, mora biti verjetnost celotnega prostora elementarnih rezultatov enaka ena. Ploščina (dvodimenzionalna Lebesgueova mera, ki jo označimo z λ 2 (A), kjer je A dogodek) kroga je po znani formuli iz šole enaka π *R 2. Nato lahko uvedemo verjetnost P(A) = λ 2 (A) / (π *R 2) in ta vrednost bo že ležala med 0 in 1 za vsak dogodek A.

Če predpostavimo, da je zadetek katere koli točke na tarči enako verjeten, se iskanje verjetnosti, da strelec zadene neko področje tarče, zmanjša na iskanje območja tega niza (od tu lahko sklepamo, da je verjetnost udarca v določeno točko je nič, ker je površina točke enaka nič).

Ugotoviti želimo na primer, kakšna je verjetnost, da strelec zadene prvih deset (dogodek A - strelec zadene želeni niz). V našem modelu je "desetka" predstavljena s krogom s središčem na ničli in polmerom r. Potem je verjetnost, da pridemo v ta krog, P(A) = λ 2 /(A)π *R 2 = π * r 2 /(π R 2)= (r/R) 2.

To je ena najpreprostejših vrst problemov "geometrijske verjetnosti" - večina teh problemov zahteva iskanje območja.

Naključne spremenljivke

Naključna spremenljivka je funkcija, ki pretvori osnovne rezultate v realna števila. Na primer, v obravnavanem problemu lahko uvedemo naključno spremenljivko ρ(ω) - razdaljo od točke udarca do središča tarče. Enostavnost našega modela nam omogoča, da eksplicitno definiramo prostor elementarnih izidov: Ω = (ω = (x,y) taka števila, da je x 2 +y 2 ≤ R 2 ) . Nato je naključna spremenljivka ρ(ω) = ρ(x,y) = x 2 +y 2 .

Sredstva za abstrakcijo iz verjetnostnega prostora. Porazdelitvena funkcija in gostota

Dobro je, če dobro poznamo strukturo prostora, a v resnici ni vedno tako. Tudi če je struktura prostora znana, je lahko kompleksna. Za opis naključnih spremenljivk, če njihov izraz ni znan, obstaja koncept porazdelitvene funkcije, ki jo označimo s F ξ (x) = P(ξ< x) (нижний индекс ξ здесь означает случайную величину). Т.е. это вероятность множества всех таких элементарных исходов, для которых значение случайной величины ξ на этом событии меньше, чем заданный параметр x .

Distribucijska funkcija ima več lastnosti:

  1. Prvič, je med 0 in 1.
  2. Drugič, ne zmanjša se, ko se njegov argument x poveča.
  3. Tretjič, ko je število -x zelo veliko, je porazdelitvena funkcija blizu 0, in ko je sam x velik, je porazdelitvena funkcija blizu 1.

Verjetno pomen te konstrukcije ob prvem branju ni najbolj jasen. Ena uporabna lastnost je, da vam distribucijska funkcija omogoča iskanje verjetnosti, da vrednost vzame vrednost iz intervala. Torej, P (naključna spremenljivka ξ vzame vrednosti iz intervala) = F ξ (b)-F ξ (a). Na podlagi te enakosti lahko preučujemo, kako se ta vrednost spremeni, če sta meji a in b intervala blizu.

Naj bo d = b-a, potem je b = a+d. In zato je F ξ (b) - F ξ (a) = F ξ (a+d) - F ξ (a) . Za majhne vrednosti d je tudi zgornja razlika majhna (če je porazdelitev zvezna). Smiselno je upoštevati razmerje p ξ (a,d)= (F ξ (a+d) - F ξ (a))/d. Če se za dovolj majhne vrednosti d to razmerje malo razlikuje od neke konstante p ξ (a), neodvisno od d, potem ima na tej točki naključna spremenljivka gostoto enako p ξ (a).

Opomba Bralci, ki so se že srečali s konceptom odvoda, bodo morda opazili, da je p ξ (a) odvod funkcije F ξ (x) v točki a. V vsakem primeru lahko preučite koncept derivata v članku na to temo na spletni strani Mathprofi.

Zdaj lahko pomen porazdelitvene funkcije definiramo takole: njen derivat (gostota p ξ, ki smo jo definirali zgoraj) v točki a opisuje, kako pogosto bo naključna spremenljivka padla v majhen interval s središčem v točki a (okolica točke a ) v primerjavi z okolicami drugih točk . Z drugimi besedami, hitreje ko distribucijska funkcija raste, večja je verjetnost, da se bo taka vrednost pojavila v naključnem poskusu.

Vrnimo se k primeru. Izračunamo lahko porazdelitveno funkcijo za naključno spremenljivko, ρ(ω) = ρ(x,y) = x 2 +y 2 , ki označuje razdaljo od središča do naključne točke zadetka na tarči. Po definiciji je F ρ (t) = P(ρ(x,y)< t) . т.е. множество {ρ(x,y) < t)} – состоит из таких точек (x,y) , расстояние от которых до нуля меньше, чем t . Мы уже считали вероятность такого события, когда вычисляли вероятность попадания в «десятку» - она равна t 2 /R 2 . Таким образом, Fρ(t) = P(ρ(x,y) < t) = t 2 /R 2 , для 0

Najdemo lahko gostoto p ρ te naključne spremenljivke. Naj takoj opazimo, da je zunaj intervala nič, ker porazdelitvena funkcija v tem intervalu je nespremenjena. Na koncu tega intervala gostota ni določena. Znotraj intervala ga je mogoče najti s pomočjo tabele izpeljank (na primer s spletne strani Mathprofi) in osnovnih pravil diferenciacije. Odvod t 2 /R 2 je enak 2t/R 2. To pomeni, da smo našli gostoto na celotni osi realnih števil.

Druga uporabna lastnost gostote je verjetnost, da funkcija prevzame vrednost iz intervala, ki se izračuna z uporabo integrala gostote po tem intervalu (kaj je to, lahko izveste v člankih o pravilnih, nepravilnih in nedoločenih integralih na spletno mesto Mathprofi).

Pri prvem branju si lahko integral po intervalu funkcije f(x) predstavljamo kot ploščino ukrivljenega trapeza. Njegove stranice so del osi Ox, vrzel (vodoravna koordinatna os), navpični segmenti, ki povezujejo točke (a,f(a)), (b,f(b)) na krivulji s točkami (a,0), (b,0 ) na osi Ox. Zadnja stran je delček grafa funkcije f od (a,f(a)) do (b,f(b)) . O integralu po intervalu (-∞; b] lahko govorimo, ko se bo pri dovolj velikih negativnih vrednostih a vrednost integrala po intervalu spremenila zanemarljivo v primerjavi s spremembo števila a. Integral po intervalih je definirana na podoben način)

Najnovejši materiali v razdelku:

Fuzijski reaktor: ITER
Fuzijski reaktor: ITER

fuzijski reaktor fuzijski reaktor Razvit v sedanjosti. (80) naprava za pridobivanje energije z reakcijami sinteze svetlobe pri....

ruska literatura.  XX stoletje  Meje 19. stoletja v kulturi ne sovpadajo s koledarskim okvirjem Hladna vojna z nekdanjimi zavezniki
ruska literatura. XX stoletje Meje 19. stoletja v kulturi ne sovpadajo s koledarskim okvirjem Hladna vojna z nekdanjimi zavezniki

Zgodovina 20. stoletja je bila polna dogodkov zelo različne narave - bila so tako velika odkritja kot velike katastrofe. Nastale so države in...

Herodot - starogrški znanstvenik, mislec, popotnik in »oče zgodovine«
Herodot - starogrški znanstvenik, mislec, popotnik in »oče zgodovine«

V tem članku so predstavljena zanimiva dejstva iz življenja velikega grškega zgodovinarja. Zanimivo dejstvo o Herodotu, ki ga lahko uporabite v svojem poročilu o...