Lastnosti mediane v statistiki. Grafična definicija mediane

Mediana- to je vrednost atributa, ki razdeli rangirano serijo porazdelitve na dva enaka dela - z vrednostmi atributa, manjšimi od mediane, in z vrednostmi atributov, večjimi od mediane. Če želite najti mediano, morate najti vrednost atributa, ki je na sredini urejenega niza.

Oglejte si rešitev problema iskanja mode in mediane Lahko

V razvrščenih nizih, nezdruženi podatki za iskanje mediane se zmanjšajo na iskanje zaporedne številke mediane. Mediano lahko izračunate z naslednjo formulo:

kjer je Xm spodnja meja medianega intervala;
im - srednji interval;
Sme je vsota opazovanj, zbranih pred začetkom medianega intervala;
fme je število opazovanj v medianem intervalu.

Lastnosti mediane

  1. Mediana ni odvisna od tistih vrednosti atributov, ki se nahajajo na obeh straneh.
  2. Analitične operacije z mediano so zelo omejene, zato pri kombiniranju dveh porazdelitev z znane mediane nemogoče je vnaprej napovedati vrednost mediane nove porazdelitve.
  3. Mediana ima lastnost minimalnosti. Njegovo bistvo je v tem, da je vsota absolutnih odstopanj vrednosti x od mediane najmanjša vrednost v primerjavi z odstopanjem X od katere koli druge vrednosti.

Grafična definicija mediane

Za določitev mediane z grafično metodo Uporabljajo akumulirane frekvence, iz katerih je sestavljena kumulativna krivulja. Oglišča ordinat, ki ustrezajo akumuliranim frekvencam, so povezana z ravnimi segmenti. Deljenje popa z zadnjo ordinato, ki ustreza skupni znesek frekvence in nanjo narišite pravokotno presečišče s kumulativno krivuljo, poiščite ordinato želene vrednosti mediane.

Določanje mode v statistiki

Moda - vrednost atributa, ki ima največjo frekvenco v statistične serije distribucije.

Opredelitev mode proizvedeno na različne načine, to pa je odvisno od tega, ali je spremenljiva karakteristika predstavljena v obliki diskretne ali intervalne serije.

Iskanje mode in mediana se izračuna tako, da preprosto pogledate stolpec frekvence. V tem stolpcu najdejo največje število, ki označuje najvišjo frekvenco. Ustreza določeni vrednosti atributa, ki je način. V seriji intervalnih variacij se način približno šteje za osrednjo različico intervala z najvišjo frekvenco. V takšni distribucijski seriji način se izračuna po formuli:

kjer je XMo spodnja meja modalnega intervala;
imo - modalni interval;
fм0, fм0-1, fм0+1 - frekvence v modalnih, prejšnjih in naslednjih modalnih intervalih.

Modalni interval je določen z najvišjo frekvenco.

Moda se pogosto uporablja v statistični praksi pri analizi povpraševanja potrošnikov, beleženju cen itd.

Razmerja med aritmetično sredino, mediano in modo

Za unimodalno simetrično vrsto porazdelitve , mediana in način sovpadajo. Za asimetrične porazdelitve niso enaki.

Poravnava na podlagi K. Pearsona različne vrste krivulje ugotovile, da za zmerno asimetrične porazdelitve veljajo naslednja približna razmerja med aritmetično sredino, mediano in modo:

Strukturna (pozicijska) povprečja– to so povprečne vrednosti, ki zavzemajo določeno mesto (položaj) v rangirani variacijski seriji.

Moda(Mo) je vrednost atributa, ki se najpogosteje pojavlja v proučevani populaciji.

Za diskretne variacijske serije moda bo vrednost možnosti z najvišjo frekvenco

Primer. Določite način z razpoložljivimi podatki (tabela 7.5).

Tabela 7.5 - Porazdelitev prodanih ženskih čevljev v trgovini s čevlji n, februar 2013

Glede na tabelo. 5 je jasno, da je najvišja frekvenca f maks= 28, ustreza vrednosti atributa x= velikost 37. torej Mo= 37 številka čevlja, tj. Prav po tej velikosti čevljev je bilo največ povpraševanja po čevljih številke 37;

IN najprej določen modalni interval, tj. ki vsebuje način – interval z najvišjo frekvenco (v primeru intervalna porazdelitev z enakimi intervali, v primeru neenakih intervalov - glede na največjo gostoto).

Način se približno šteje za sredino modalnega intervala. Posebna vrednost načina za intervalno serijo je določena s formulo:

kje x Mo– spodnja meja modalnega intervala;

i Mo– vrednost modalnega intervala;

f Mo– pogostost modalnega intervala;

f Mo -1– frekvenca intervala pred modalnim;

f Mo +1– frekvenca intervala, ki sledi modalnemu.

Primer. Določite način z razpoložljivimi podatki (tabela 7.6).

Tabela 7.6 – Razporeditev zaposlenih po delovni dobi

Glede na tabelo. 6 je jasno, da je najvišja frekvenca f maks= 35, ustreza intervalu: 6-8 let (modalni interval). Določimo način s formulo:

leta.

torej Mo= 6,8 leta, tj. Večina zaposlenih ima 6,8 let izkušenj.

Ime mediana je vzeto iz geometrije, kjer se nanaša na odsek, ki povezuje eno od oglišč trikotnika s sredino nasprotna stran in tako razdeli stranico trikotnika na dva enaka dela.

Mediana(jaz) To je vrednost atributa, ki spada v sredino rangirane populacije. V nasprotnem primeru je mediana vrednost, ki deli število urejenih variacijskih serij na dva enaka dela - en del ima vrednosti spremenljive značilnosti manjše od povprečne opcije, drugi pa večje vrednosti.

Za uvrščene serije(tj. naročeno - vgrajeno naraščajočem vrstnem redu ali zmanjševanje posamezne vrednote značilnost) z lihim številom členov ( n= liho) mediana je možnost, ki se nahaja na sredini vrstice. Redna številka mediane ( N jaz) je opredeljeno na naslednji način:

N Me =(n+1)/ 2.

Primer. V nizu 51 členov je mediana števila (51+1)/2 = 26, tj. Mediana je opcija, ki je 26. po vrstnem redu.

Za rangirano serijo s sodim številom členov ( n= celo) – mediana bo aritmetična sredina dveh vrednosti atributa, ki se nahajata na sredini serije. Serijske številke obeh osrednjih možnosti so določene na naslednji način:

N Me 1 =n/ 2; N Me 2 =(n/ 2)+ 1.

Primer. Ko je n=50; N Me1 = 50/2 = 25; N Me2= (50/2)+1 = 26, tj. Mediana je povprečje možnosti, ki sta 25. in 26. po vrsti.

IN diskretna variacijske serije Mediano določimo z akumulirano frekvenco, ki ustreza zaporedni številki mediane ali jo prvič preseže. V nasprotnem primeru je akumulirana frekvenca enaka ali prvič preseže polovico vsote vseh frekvenc serije.

Primer. Na podlagi razpoložljivih podatkov določite mediano (tabela 7.7).

Tabela 7.7 - Porazdelitev prodanih ženskih čevljev v trgovini s čevlji n, februar 2013

Glede na tabelo. 7 definirati serijsko številko mediane: N jaz =( 67+1)/2=34.

Moda. Mediana. Metode za njihov izračun (stran 1 od 2)

Skupna frekvenca, ki prvič preseže to vrednost S= 41, ustreza vrednosti atributa x= velikost 37. torej jaz= 37 številka čevlja, tj. Polovica parov je kupljenih manjših od velikosti 37, druga polovica pa večjih.

V tem primeru sta način in mediana enaka, vendar morda nista enaka.

IN intervalne variacijske serije akumulirane frekvence se določijo na podlagi podatkov o akumuliranih frekvencah, ki jih najdemo srednji interval– interval, v katerem je akumulirana frekvenca polovica ali prvič preseže polovico skupne vsote frekvenc. Formula za določanje mediane v intervalne serije distribucija ima naslednjo obliko:

.

kje x Jaz– spodnja meja medianega intervala;

jaz jaz– vrednost medianega intervala;

f i– vsota frekvenc serije;

S Jaz -1– vsota akumuliranih frekvenc intervala pred mediano;

f jaz– frekvenca medianega intervala.

Primer. Na podlagi razpoložljivih podatkov določite mediano (tabela 7.8).

Tabela 7.8 – Razporeditev zaposlenih po delovni dobi

Glede na tabelo. 8 določimo zaporedno številko mediane: N Me = 100/2=50. Skupna frekvenca, ki prvič preseže to vrednost S= 82, ustreza intervalu 6-8 let (mediani interval). V tem primeru sta modalni interval in srednji interval enaka, vendar morda nista enaka. Določimo mediano s formulo:

leta

torej jaz= 6,2 leta, tj. polovica delavcev ima manj kot 6,2 leta izkušenj, druga polovica pa več kot 6,2 leta izkušenj.

Najdena sta mod in mediana široka uporaba V različna področja gospodarstvo. Tako izračun modalne produktivnosti dela, modalnih stroškov itd. omogoča ekonomistu presojo prevladujočega v tem trenutku njihov nivo. To značilnost je treba uporabiti za identifikacijo rezerv našega gospodarstva. Moda je pomembna pri odločitvi praktični problemi. Tako se pri načrtovanju množične proizvodnje oblačil in obutve določi velikost izdelka, po kateri je največje povpraševanje (modalna velikost). Način se lahko uporablja kot približna značilnost ravni značilnosti, ki se proučuje, namesto aritmetične sredine, če je porazdelitev frekvence blizu simetrične in ima eno neravno točko.

Mediano je treba uporabiti kot povprečno vrednost v primerih, ko ni dovolj zaupanja v homogenost proučevane populacije. Na mediano ne vplivajo toliko same vrednosti kot število primerov na določeni ravni. Upoštevati je treba tudi, da je mediana vedno specifična (pri velikem številu opazovanj ali v primeru lihega števila članov populacije), ker pod Mah impliciran je nek dejanski realni element populacije, medtem ko aritmetična sredina pogosto prevzame vrednost, ki je ne more prevzeti nobena druga enota v populaciji.

Glavna lastnina Mah je, da je vsota absolutnih odstopanj vrednosti atributa od mediane manjša kot od katere koli druge vrednosti: . Ta lastnost Mah se lahko uporabi na primer pri določanju gradbišča javne zgradbe, ker Mah določa točko, ki daje najkrajšo oddaljenost npr. vrtca od kraja bivanja staršev, stanovalcev. naselje od kina, pri projektiranju tramvajskih in trolejbusnih postajališč itd.

V sistemu strukturnih kazalnikov so indikatorji značilnosti distribucijske oblike možnosti, ki zasedajo določeno mesto v rangirani variacijski seriji (vsak četrti, peti, deseti, petindvajseti itd.). Podobno lahko z iskanjem mediane v variacijskih serijah najdete vrednost značilnosti za katero koli enoto rangirane serije.

Kvartili– značilne vrednosti, ki razdelijo rangirano populacijo na štiri enake dele. Obstajajo spodnji kvartili ( V1), povprečje ( 2. vprašanje) in vrh ( V3). Spodnji kvartil ločuje 1/4 populacije z najnižjimi vrednostmi značilnosti, zgornji - 1/4 populacije z najvišje vrednosti znak. To pomeni, da bo 25 % enot v populaciji manjših V1; 25 % enot bo sklenjenih med V1 in 2. vprašanje; 25 % – med 2. vprašanje in V3; preostalih 25% presega V3. Srednji kvartil ( 2. vprašanje) je mediana .

Za izračun kvartilov z uporabo intervalne serije uporabite naslednje formule:

;

.

kje x Q1– spodnja meja intervala, ki vsebuje spodnji kvartil (interval je določen z akumulirano frekvenco, pri čemer prva presega 25 %);

x Q3– spodnja meja intervala, ki vsebuje zgornji kvartil (interval je določen z akumulirano frekvenco, prva presega 75 %);

S V 1-1– akumulirana frekvenca intervala pred intervalom, ki vsebuje spodnji kvartil;

S V 3-1– akumulirana frekvenca intervala pred intervalom, ki vsebuje zgornji kvartil;

f Q1– frekvenca intervala, ki vsebuje spodnji kvartil;

f Q3– frekvenca intervala, ki vsebuje zgornji kvartil.

decili– to so variantne vrednosti, ki razvrščeno serijo delijo z deset enake dele: 1. decil ( d 1) deli prebivalstvo v razmerju 1/10 proti 9/10, 2. decil ( d 2) - v razmerju 2/10 do 8/10 itd. Decili se izračunajo po isti shemi kot mediana in kvartili:

;

.

Uporaba porazdelitve značilnosti, obravnavanih zgoraj, v analizi variacijskih serij nam omogoča, da poglobljeno in podrobno označimo proučevano populacijo.

GLEJ VEČ:

Strukturna povprečja

Skupaj s povprečji moči razširjena pridobljena strukturna povprečja.

Struktura statistični agregati lahko drugačen. Poleg tega, bolj kot je simetrična porazdelitev populacijskih enot, bolj kvalitativno homogena je njena sestava glede na preučevano značilnost, bolje in bolj zanesljivo povprečna vrednost značilnosti označuje preučevani pojav. Toda za primere ostre asimetrije porazdelitvenih nizov aritmetična sredina ni več tako značilna. Na primer, povprečna višina vloge v hranilnicah ni posebej zanimiva, saj je večina vlog pod to ravnjo, na povprečje pa pomembno vplivajo velike vloge, ki jih je malo in niso značilne za množico bank. depoziti.

Moda (statistika)

V takih primerih statistika uporablja drug sistem - sistem pomožnih strukturnih povprečij. Sem spadajo moda, mediana, pa tudi kvarteli, kvinteli, decili, odstotki.

Moda (Mo)– najpogostejša vrednost značilnosti, v diskretni variacijski seriji pa je to različica z največjo frekvenco.

V statistični praksi se moda uporablja pri preučevanju dohodka prebivalstva, povpraševanja potrošnikov, registracije cen ter pri analizi nekaterih tehničnih in ekonomskih kazalnikov uspešnosti podjetij.

V nekaterih primerih je zanimiv način in ne aritmetična sredina. Včasih se uporablja namesto aritmetične sredine, na primer za karakterizacijo strukture serije porazdelitve.

Postopek določanja načina je odvisen od vrste razdelilne serije. Če je spremenljiva značilnost predstavljena v obliki diskretne serije, potem za določitev načina niso potrebni izračuni. V takem nizu bo način vrednost atributa, ki ima najvišjo frekvenco.

Če je vrednost značilnosti predstavljena v obliki niza intervalnih variacij z enakimi intervali, se način določi z izračunom po formuli:

kje X Mo– spodnja meja modalnega intervala,

i Mo– vrednost modalnega intervala,

f Mo , f Mo-1 , f pn+1– oziroma frekvence modalnih, premodalnih (prejšnjih) in postmodalnih (naslednjih modalnih) intervalov.

Mediana (jaz)– to je vrednost karakteristike, ki je v sredini rangirane variacijske serije, kjer posamezne vrednote značilnosti (različice) so razvrščene v naraščajočem ali padajočem vrstnem redu (po rangu).

Mediano je treba uporabiti kot povprečno vrednost v primerih, ko ni dovolj zaupanja v homogenost proučevane populacije. Mediana se uporablja v marketinških dejavnostih. Na primer, lokacija dvigal, primarnih vinogradniških obratov, tovarn konzerv, vsota razdalj do katerih od dobaviteljev surovin mora biti najmanjša.

Mediana je tako kot način definirana na različne načine. To je odvisno od strukture distribucijske serije.
Za določitev mediane v nizu diskretnih variacij:

1) poiščite njegovo serijsko številko s formulo

N jaz =
2) sestavite niz akumuliranih frekvenc

3) poiščite akumulirano frekvenco, ki je enaka zaporedni številki mediane ali jo presega

4) možnost, ki ustreza dani akumulirani frekvenci, je mediana.

Če je število členov diskretne serije liho, je mediana na sredini serije in deli to vrsto na pol na dva enaka dela glede na število členov serije. Zaporedna številka mediane se v tem primeru izračuna po formuli:

N Me =(f + 1)2,

kje fštevilo članov serije.

Pri intervalnih serijah se najprej določi mediani interval. Za to velja enako kot pri diskretne serije, izračunajte zaporedno številko mediane. Akumulirana frekvenca, ki je enaka mediani številki ali prva, ki jo preseže, v seriji intervalnih variacij ustreza mediani intervalu. Označimo to akumulirano frekvenco S Me. Mediana se neposredno izračuna po formuli:

,
kjer je spodnja meja medianega intervala

- vrednost medianega intervala

— akumulirana frekvenca intervala pred mediano

— pogostost medianega intervala

Grafična definicija mode in mediane
Mod in mediano v intervalni seriji lahko določimo grafično.

Način se določi iz distribucijskega histograma. Če želite to narediti, izberite najvišji pravokotnik, ki je v tem primeru modalen. Nato povežemo desno oglišče modalnega pravokotnika z zgornjim desnim kotom prejšnjega pravokotnika. In levo oglišče modalnega pravokotnika - z zgornjim levim kotom naslednjega pravokotnika. Nato se od točke njihovega presečišča spusti navpičnica na os abscise. Abscisa točke presečišča teh črt bo način porazdelitve (slika 1). Mediana je izračunana iz kumulata (slika 2). Da bi jo določili, se od točke na lestvici akumuliranih frekvenc (frekvenc), ki ustreza 50%, nariše ravna črta vzporedno z osjo abscise, dokler se ne preseka s kumulato. Nato se od presečišča označene črte s kumulato spusti navpičnica na os abscise. Abscisa presečišča je mediana.

Indikatorji variacije v statistiki.

V teku statistična analiza Lahko pride do situacije, ko vrednosti povprečnih vrednosti sovpadajo, populacije, na podlagi katerih se izračunajo, pa so sestavljene iz enot, katerih vrednosti atributov se precej razlikujejo med seboj. V tem primeru se izračunajo indeksi variacije.

Katalog: prenosi -> Sotrudniki
prenosi -> N. L. Ivanova M. F. Lukanina
prenosi -> Predavanje za dhow specialisti in starši »Preventiva agresivno vedenje predšolski otroci"
prenosi -> Psihološka profesionalna prilagoditev osebnosti
prenosi -> Oddelek za izobraževanje in znanost regije Kemerovo Regionalni psihološki in valeološki center Kemerovo
prenosi -> Zvezna služba Oddelek Ruske federacije za nadzor drog za regijo Kemerovo
Sotrudniki -> Bow Čuvaška republika SPO "Chetk" Ministrstvo za izobraževanje Čuvašije
prenosi -> Značilnosti psihološke in pedagoške podpore za razvoj predšolskih otrok
prenosi -> Mishina M. M. Razvoj mišljenja glede na vključenost v družinske odnose
Sotrudniki -> Oblikovanje poklicno pomembnih kvalitet pri študentih z motnjami v duševnem razvoju po poklicu

TEST

Na temo: "Mode. Mediana. Metode za njihov izračun"

Uvod

Povprečne vrednosti in z njimi povezani indikatorji variacije igrajo zelo pomembno vlogo v statistiki, kar je posledica predmeta njenega preučevanja. zato ta tema je eden osrednjih v tečaju.

Povprečje je zelo pogosta skupna mera v statistiki. To je razloženo z dejstvom, da je le s pomočjo povprečja mogoče populacijo označiti s količinsko spremenljivo značilnostjo. Povprečna velikost v statistiki se imenuje posplošujoča značilnost niza istovrstnih pojavov glede na neko kvantitativno spremenljivo značilnost. Povprečje kaže stopnjo te lastnosti na enoto populacije.

Ko preučujejo družbene pojave in poskušajo prepoznati njihove značilne, tipične značilnosti v določenih razmerah kraja in časa, statistiki pogosto uporabljajo povprečne vrednosti. Z uporabo povprečij lahko primerjate različne populacije med seboj glede na različne značilnosti.

Povprečja, ki se uporabljajo v statistiki, spadajo v razred potenčnih povprečij. Od potenčnih povprečij se najpogosteje uporablja aritmetična sredina, redkeje harmonična sredina; Harmonična sredina se uporablja samo pri izračunu povprečnih stopenj dinamike, povprečna kvadratna pa samo pri izračunu indeksov variacije.

Aritmetična sredina je količnik deljenja vsote variant z njihovim številom. Uporablja se v primerih, ko se obseg spremenljive značilnosti za celotno populacijo oblikuje kot vsota značilnih vrednosti njenih posameznih enot. Aritmetična sredina je najpogostejša vrsta povprečja, saj ustreza naravi družbenih pojavov, kjer se obseg spreminjajočih se značilnosti v agregatu najpogosteje oblikuje prav kot vsota značilnih vrednosti posameznih enot populacije. .

Harmonično povprečje je treba glede na njegovo definirajočo lastnost uporabiti, ko je skupna glasnost atributa oblikovana kot vsota vzajemne vrednosti možnost. Uporablja se, ko uteži glede na material ni treba pomnožiti, ampak razdeliti na možnosti ali, kar je isto, pomnožiti z njihovo obratno vrednostjo. Harmonična sredina je v teh primerih recipročna vrednost aritmetične sredine vzajemnih vrednosti atributa.

Harmonično sredino je treba uporabiti v primerih, ko se kot uteži ne uporabljajo enote populacije - nosilci značilnosti, temveč produkti teh enot z vrednostjo značilnosti.

1. Opredelitev mode in mediane v statistiki

Aritmetične in harmonične sredine so posplošujoče značilnosti populacije glede na eno ali drugo spremenljivo značilnost. Pomožni opisni značilnosti porazdelitve spremenljive značilnosti sta mod in mediana.

V statistiki je način vrednost značilnosti (varianta), ki se najpogosteje pojavlja v določeni populaciji. V variacijski seriji bo to možnost z najvišjo frekvenco.

V statistiki je mediana možnost, ki je na sredini variacijske serije. Mediana deli vrsto na pol; na obeh straneh (navzgor in navzdol) je enako število populacijskih enot.

Modus in mediana sta v nasprotju s sredstvi moči specifični značilnosti; njun pomen je pripisan kateri koli posebni možnosti v nizu variacij.

Način se uporablja v primerih, ko je treba karakterizirati najpogostejšo vrednost značilnosti.

5.5 Način in mediana. Njihov izračun v diskretnih in intervalnih variacijskih vrstah

Če morate na primer izvedeti najpogostejšo stopnjo plače v podjetju, ceno na trgu, po kateri je bilo prodano največje število blago, velikost čevlja, po kateri je med potrošniki največ povpraševanja ipd., se v teh primerih zatečejo k modi.

Mediana je zanimiva v tem, da kaže kvantitativno mejo vrednosti spremenljive lastnosti, ki jo je dosegla polovica pripadnikov populacije. Naj bo povprečna plača bančnih uslužbencev 650.000 rubljev. na mesec. To značilnost lahko dopolnimo, če rečemo, da je polovica delavcev prejela plačo 700.000 rubljev. in višje, tj. Dajmo mediano. Način in mediana sta tipične lastnosti v primerih, ko so zbirke homogene in številčne.

Iskanje modusa in mediane v diskretnem variacijskem nizu

Iskanje načina in mediane v variacijski seriji, kjer so vrednosti značilnosti podane z določenimi številkami, ni zelo težko. Poglejmo tabelo 1 z razdelitvijo družin po številu otrok.

Tabela 1. Porazdelitev družin po številu otrok

Očitno bo v tem primeru modna družina z dvema otrokoma, saj ta vrednost možnosti ustreza največjemu številu družin. Obstajajo lahko distribucije, kjer se vse možnosti pojavljajo enako pogosto, v tem primeru ni načina ali, z drugimi besedami, lahko rečemo, da so vse možnosti enako modalne. V drugih primerih sta lahko največja frekvenca ne ena, ampak dve možnosti. Potem bosta dva načina, porazdelitev bo bimodalna. Bimodalne porazdelitve lahko kažejo na kvalitativno heterogenost populacije glede na preučevano značilnost.

Če želite najti mediano v seriji diskretnih variacij, morate vsoto frekvenc razdeliti na polovico in rezultatu dodati ½. Torej bo pri porazdelitvi 185 družin po številu otrok mediana: 185/2 + ½ = 93, tj. 93. možnost, ki naročeno vrstico deli na polovico. Kaj pomeni 93. možnost? Če želite izvedeti, morate kopičiti frekvence, začenši od najmanjših možnosti. Vsota frekvenc 1. in 2. možnosti je 40. Jasno je, da tukaj ni 93 možnosti. Če frekvenco 3. možnosti prištejemo 40, dobimo vsoto, ki je enaka 40 + 75 = 115. Posledično 93. možnost ustreza tretji vrednosti spremenljive značilnosti, mediana pa bo družina z dvema otrokoma.

Način in mediana v v tem primeru sovpadalo. Če bi imeli sodo vsoto frekvenc (na primer 184), bi z uporabo zgornje formule dobili število mediane možnosti, 184/2 + ½ =92,5. Ker ni delnih možnosti, rezultat kaže, da je mediana na sredini med 92 in 93 možnostmi.

3. Izračun mode in mediane v nizu intervalnih variacij

Opisna narava mode in mediane je posledica dejstva, da ne kompenzirata posameznih odstopanj. Vedno ustrezajo določeni možnosti. Zato način in mediana ne zahtevata izračunov, da bi ugotovili, ali so znane vse vrednosti atributa. Vendar pa se v seriji intervalnih variacij uporabljajo izračuni za iskanje približne vrednosti mode in mediane znotraj določenega intervala.

Za izračun določene vrednosti modalne vrednosti funkcije, vsebovane v intervalu, uporabite formulo:

M o = X Mo + i Mo *(f Mo – f Mo-1)/((f Mo – f Mo-1) + (f Mo – f Mo+1)),

kjer je XMo najmanjša meja modalnega intervala;

i Mo – vrednost modalnega intervala;

f Mo – frekvenca modalnega intervala;

f Mo-1 – frekvenca intervala pred modalnim;

f Mo+1 – frekvenca intervala, ki sledi modalnemu.

Pokažimo izračun načina na primeru iz tabele 2.

Tabela 2. Porazdelitev delavcev v podjetjih po izpolnjevanju proizvodnih standardov

Da bi našli način, najprej določimo modalni interval ta serija. Primer kaže, da najvišja frekvenca ustreza intervalu, kjer so variante v območju od 100 do 105. To je modalni interval. Vrednost modalnega intervala je 5.

Nadomeščanje številčne vrednosti iz tabele 2. v zgornjo formulo dobimo:

M o = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108,8

Pomen te formule je naslednji: vrednost tistega dela modalnega intervala, ki ga je treba dodati njegovi minimalni meji, se določi glede na velikost frekvenc predhodnega in naslednjih intervalov. V tem primeru 100 dodamo 8,8, tj. več kot polovico intervala, ker je frekvenca predhodnega intervala manjša od frekvence naslednjega intervala.

Izračunajmo zdaj mediano. Da bi našli mediano v seriji intervalnih variacij, najprej določimo interval, v katerem se nahaja (interval mediane). Takšen interval bo tisti, katerega kumulativna frekvenca je enaka ali večja od polovice vsote frekvenc. Kumulativne frekvence nastanejo s postopnim seštevanjem frekvenc, začenši z intervalom najnižjo vrednost znak. Polovica vsote frekvenc je 250 (500:2). Zato bo v skladu s tabelo 3 srednji interval interval z vrednostjo plače 350.000 rubljev. do 400.000 rubljev.

Tabela 3. Izračun mediane v seriji intervalnih variacij

Pred tem intervalom je bila vsota akumuliranih frekvenc 160. Zato je za pridobitev mediane treba prišteti še 90 enot (250 – 160).

Pri določanju mediane vrednosti se predpostavlja, da je vrednost enot znotraj intervala enakomerno porazdeljena. Torej, če je 115 enot, ki se nahajajo v tem intervalu, enakomerno porazdeljenih v intervalu, ki je enak 50, bo naslednja vrednost ustrezala 90 enotam:

Moda v statistiki

Mediana (statistika)

Mediana (statistika), V matematična statistika— število, ki označuje vzorec (na primer niz številk). Če so vsi vzorčni elementi različni, je mediana številka vzorca, tako da je točno polovica vzorčnih elementov večja od nje, druga polovica pa manjša od nje.

Na splošno lahko mediano ugotovimo tako, da elemente vzorca razporedimo v naraščajočem ali padajočem vrstnem redu in vzamemo srednji element. Na primer, vzorec (11, 9, 3, 5, 5) se po razvrščanju spremeni v (3, 5, 5, 9, 11), njegova mediana pa je številka 5. Če ima vzorec sodo število elementov, je mediana morda ni enolično določena: za numerične podatke se najpogosteje uporablja polovična vsota dveh sosednjih vrednosti (to pomeni, da je mediana niza (1, 3, 5, 7) enaka 4).

Z drugimi besedami, mediana v statistiki je vrednost, ki deli niz na pol tako, da se na obeh straneh (navzdol ali navzgor) nahaja enako število enote dane populacije. Zaradi te lastnosti ima ta indikator več drugih imen: 50. percentil ali 0,5 kvantil.

Mediana se uporablja namesto aritmetične sredine, kadar se skrajni možnosti rangirane serije (najmanjša in največja) v primerjavi z ostalimi izkažeta za prevelike ali pretirano majhne.

Funkcija MEDIAN meri osrednjo tendenco, ki je središče niza števil v statistična porazdelitev. Obstajajo trije najpogostejši načini za določitev osrednje tendence:

  • Povprečna vrednost- aritmetična sredina, ki se izračuna tako, da seštejemo niz števil in nato dobljeno vsoto delimo z njihovim številom.
    Na primer, je povprečje števil 2, 3, 3, 5, 7 in 10 5, kar je rezultat deljenja njihove vsote 30 z njihovo vsoto 6.
  • Mediana- število, ki je sredina niza števil: polovica števil ima vrednosti, večje od mediane, polovica števil pa manjše vrednosti.
    Na primer, je mediana za števila 2, 3, 3, 5, 7 in 10 4.
  • Moda- številka, ki jo najpogosteje najdemo v dani nizštevilke.

    Na primer, je način za številke 2, 3, 3, 5, 7 in 10 3.

Za karakterizacijo porazdelitvenih serij (struktura variacijskih serij), skupaj s povprečjem, ti. strukturna povprečja: moda in mediana.

Moda V gospodarski praksi se najpogosteje uporabljata mod in mediana.

IN - možnost, ki jo najpogosteje najdemo v porazdelitveni seriji (v določeni populaciji). diskretna

v variacijskih serijah je način določen z najvišjo frekvenco. Recimo, da izdelek A v mestu prodaja 9 podjetij po naslednjih cenah v rubljih:

44; 43; 44; 45; 43; 46; 42; 46;43. Ker je najpogostejša cena 43 rubljev, bo modalna. Pri karakterizaciji

IN družbene skupine prebivalstvo glede na raven dohodka bi moralo uporabljati modalno vrednost namesto povprečja. Povprečje bo nekatere kazalnike podcenilo in druge precenilo - s tem pa bodo povprečeni (izenačeni) dohodki vseh segmentov prebivalstva.

    interval

    v variacijskih serijah je način približno določen s formulo:

    ХМ0 - spodnja meja modalnega intervala;

    h Mo - vrednost (korak, širina) modalnega intervala;

    f 1 - lokalna frekvenca intervala pred modalnim;

f 2 - lokalna frekvenca modalnega intervala;

f 3 - lokalna frekvenca intervala, ki sledi modalnemu. Porazdelitev prebivalstva po višini povprečnega mesečnega dohodka na prebivalca Interval 1000-3000 V

dano distribucijo

Moda bo modalno, saj ima največjo frekvenco (f=35,5). Potem bo po zgornji formuli način enak:

Mediana Na grafu (histogramu porazdelitve) način določimo takole: na ordinatni osi so narisane lokalne frekvence, na abscisni osi pa intervali ali intervalna središča. Izberite najvišji stolpec, ki ustreza vrednosti značilnosti z najvišjo frekvenco v porazdelitveni vrstici. uporablja za reševanje nekaterih praktičnih problemov. Tako se na primer pri preučevanju tržnega prometa vzame modalna cena; preučuje se povpraševanje po čevljih in oblačilih, uporabljajo se modalne velikosti čevljev in oblačil.- to je številčna vrednost značilnosti za tisto enoto populacije, ki je na sredini razvrščene serije (zgrajena v naraščajočem ali padajočem vrstnem redu vrednosti lastnosti, ki se proučuje). Mediana včasih imenovano srednja možnost, ker razdeli agregat na dva enaka dela tako, da je na obeh straneh enako število enot agregata. Če so vsem enotam serije dodeljene serijske številke, bo serijska številka mediane določena s formulo (n+1): 2 za serijo, kjer je n - liho. Če vrstica z celo

V serijah diskretnih variacij z lihim številom agregatnih enot je to določena numerična vrednost na sredini serije.

Iskanje mediane v nizih intervalnih variacij zahteva predhodno določitev intervala, v katerem se mediana nahaja, tj. mediana interval– za ta interval je značilno, da je njegova kumulativna (akumulirana) frekvenca enaka polovici vsote ali presega polovično vsoto vseh frekvenc serije.

    X Me - spodnja meja medianega intervala

    h Me je vrednost medianega intervala;

    S Me-1 je vsota akumuliranih frekvenc intervala pred medianim intervalom;

    f Me je lokalna frekvenca medianega intervala.

S pomočjo podatkov tabele določimo mediano vrednost povprečnega dohodka na prebivalca. Če želite to narediti, morate določiti, kateri interval bo mediana. Uporabimo formulo za število mediane enote serije, tj. sredina:

Delna vrednost N (vedno z sodo številočlanov), ki je enak 50,5 %, pomeni, da je sredina niza med 50 % in 51 %, tj. v tretjem intervalu. Z drugimi besedami: mediana se šteje za interval, ki prvi predstavlja več kot polovico vsote akumuliranih frekvenc. Od tod mediana:

Za grafično določitev intervala, v katerem se nahaja mediana, so na ordinatni osi narisane akumulirane frekvence, na abscisni osi pa središča intervalov. Od točke na ordinatni osi, ki ustreza 50,5 % vsote akumuliranih frekvenc, potegnite črto, vzporedno z abscisno osjo, dokler se ne preseka s kumulato. Iz presečišča spustimo navpičnico na abscisno os.

Razmerje med načinom, mediano in aritmetično sredino kaže na naravo porazdelitve značilnosti v agregatu in nam omogoča, da ocenimo njeno asimetrijo.

Če je M 0

Iz razmerja teh kazalnikov je treba sklepati, da obstaja desna asimetrija v porazdelitvi prebivalstva po višini povprečnega denarnega dohodka na prebivalca: Kvartil

– to je četrti del populacije, definiran kot mediana, le vsota frekvenc mora biti deljena s 4, pri določanju kvartilnega intervala pa mora biti kumulativna frekvenca večja ali enaka četrtini vsote frekvence populacije. Decile

TEST

Na temo: "Mode. Mediana. Metode za njihov izračun"


Uvod

– razdeli celoto na deset enakih delov. Določi se na enak način kot kvartil, le da mora biti vsota frekvenc deljena z 10.

Povprečje je zelo pogosta skupna mera v statistiki. To je razloženo z dejstvom, da je le s pomočjo povprečja mogoče populacijo označiti s količinsko spremenljivo značilnostjo. V statistiki je povprečna vrednost posplošujoča značilnost niza podobnih pojavov, ki temelji na neki kvantitativno spremenljivi značilnosti. Povprečje kaže stopnjo te lastnosti na enoto populacije.

Ko preučujejo družbene pojave in poskušajo prepoznati njihove značilne, tipične značilnosti v določenih razmerah kraja in časa, statistiki pogosto uporabljajo povprečne vrednosti. Z uporabo povprečij lahko primerjate različne populacije med seboj glede na različne značilnosti.

Povprečja, ki se uporabljajo v statistiki, spadajo v razred potenčnih povprečij. Od potenčnih povprečij se najpogosteje uporablja aritmetična sredina, redkeje harmonična sredina; Harmonična sredina se uporablja samo pri izračunu povprečnih stopenj dinamike, povprečna kvadratna pa samo pri izračunu indeksov variacije.

Aritmetična sredina je količnik deljenja vsote variant z njihovim številom. Uporablja se v primerih, ko se obseg spremenljive značilnosti za celotno populacijo oblikuje kot vsota značilnih vrednosti njenih posameznih enot. Aritmetična sredina je najpogostejša vrsta povprečja, saj ustreza naravi družbenih pojavov, kjer se obseg spreminjajočih se značilnosti v agregatu najpogosteje oblikuje prav kot vsota značilnih vrednosti posameznih enot populacije. .

Glede na svojo definirajočo lastnost je treba harmonično povprečje uporabiti, ko je skupna glasnost atributa oblikovana kot vsota inverznih vrednosti različice. Uporablja se, ko uteži glede na material ni treba pomnožiti, ampak razdeliti na možnosti ali, kar je isto, pomnožiti z njihovo obratno vrednostjo. Harmonična sredina je v teh primerih recipročna vrednost aritmetične sredine vzajemnih vrednosti atributa.

Harmonično sredino je treba uporabiti v primerih, ko se kot uteži ne uporabljajo enote populacije - nosilci značilnosti, temveč produkti teh enot z vrednostjo značilnosti.


1. Opredelitev mode in mediane v statistiki

Aritmetične in harmonične sredine so posplošujoče značilnosti populacije glede na eno ali drugo spremenljivo značilnost. Pomožni opisni značilnosti porazdelitve spremenljive značilnosti sta mod in mediana.

V statistiki je način vrednost značilnosti (varianta), ki se najpogosteje pojavlja v določeni populaciji. V variacijski seriji bo to možnost z najvišjo frekvenco.

V statistiki je mediana možnost, ki je na sredini variacijske serije. Mediana deli vrsto na pol; na obeh straneh (navzgor in navzdol) je enako število populacijskih enot.

Modus in mediana sta v nasprotju s sredstvi moči specifični značilnosti; njun pomen je pripisan kateri koli posebni možnosti v nizu variacij.

Način se uporablja v primerih, ko je treba karakterizirati najpogostejšo vrednost značilnosti. Če je treba na primer ugotoviti najpogostejšo plačo v podjetju, ceno na trgu, po kateri je bilo prodano največ blaga, velikost čevlja, po kateri je največje povpraševanje med potrošniki itd. v teh primerih se zatekajo k modi.

Mediana je zanimiva v tem, da kaže kvantitativno mejo vrednosti spremenljive lastnosti, ki jo je dosegla polovica pripadnikov populacije. Naj bo povprečna plača bančnih uslužbencev 650.000 rubljev. na mesec. To značilnost lahko dopolnimo, če rečemo, da je polovica delavcev prejela plačo 700.000 rubljev. in višje, tj. Dajmo mediano. Način in mediana sta tipični značilnosti v primerih, ko so populacije homogene in velike.


2. Iskanje modusa in mediane v diskretnem variacijskem nizu

Iskanje načina in mediane v variacijski seriji, kjer so vrednosti značilnosti podane z določenimi številkami, ni zelo težko. Poglejmo tabelo 1 z razdelitvijo družin po številu otrok.

Tabela 1. Porazdelitev družin po številu otrok

Očitno bo v tem primeru modna družina z dvema otrokoma, saj ta vrednost možnosti ustreza največjemu številu družin. Obstajajo lahko distribucije, kjer se vse možnosti pojavljajo enako pogosto, v tem primeru ni načina ali, z drugimi besedami, lahko rečemo, da so vse možnosti enako modalne. V drugih primerih sta lahko največja frekvenca ne ena, ampak dve možnosti. Potem bosta dva načina, porazdelitev bo bimodalna. Bimodalne porazdelitve lahko kažejo na kvalitativno heterogenost populacije glede na preučevano značilnost.

Če želite najti mediano v seriji diskretnih variacij, morate vsoto frekvenc razdeliti na polovico in rezultatu dodati ½. Torej bo pri porazdelitvi 185 družin po številu otrok mediana: 185/2 + ½ = 93, tj. 93. možnost, ki naročeno vrstico deli na polovico. Kaj pomeni 93. možnost? Če želite izvedeti, morate kopičiti frekvence, začenši od najmanjših možnosti. Vsota frekvenc 1. in 2. možnosti je 40. Jasno je, da tukaj ni 93 možnosti. Če frekvenco 3. možnosti prištejemo 40, dobimo vsoto, ki je enaka 40 + 75 = 115. Posledično 93. možnost ustreza tretji vrednosti spremenljive značilnosti, mediana pa bo družina z dvema otrokoma.

Način in mediana v tem primeru sta sovpadala. Če bi imeli sodo vsoto frekvenc (na primer 184), bi z uporabo zgornje formule dobili število mediane možnosti, 184/2 + ½ =92,5. Ker ni delnih možnosti, rezultat kaže, da je mediana na sredini med 92 in 93 možnostmi.

3. Izračun mode in mediane v nizu intervalnih variacij

Opisna narava mode in mediane je posledica dejstva, da ne kompenzirata posameznih odstopanj. Vedno ustrezajo določeni možnosti. Zato način in mediana ne zahtevata izračunov, da bi ugotovili, ali so znane vse vrednosti atributa. Vendar pa se v seriji intervalnih variacij uporabljajo izračuni za iskanje približne vrednosti mode in mediane znotraj določenega intervala.

Za izračun določene vrednosti modalne vrednosti funkcije, vsebovane v intervalu, uporabite formulo:

M o = X Mo + i Mo *(f Mo – f Mo-1)/((f Mo – f Mo-1) + (f Mo – f Mo+1)),

kjer je XMo najmanjša meja modalnega intervala;

i Mo – vrednost modalnega intervala;

f Mo – frekvenca modalnega intervala;

f Mo-1 – frekvenca intervala pred modalnim;

f Mo+1 – frekvenca intervala, ki sledi modalnemu.

Pokažimo izračun načina na primeru iz tabele 2.


Tabela 2. Porazdelitev delavcev v podjetjih po izpolnjevanju proizvodnih standardov

Da bi našli način, najprej določimo modalni interval te serije. Primer kaže, da najvišja frekvenca ustreza intervalu, kjer so variante v območju od 100 do 105. To je modalni interval. Vrednost modalnega intervala je 5.

Če nadomestimo številčne vrednosti iz tabele 2 v zgornjo formulo, dobimo:

M o = 100 + 5 * (104 -12)/((104 – 12) + (104 – 98)) = 108,8

Pomen te formule je naslednji: vrednost tistega dela modalnega intervala, ki ga je treba dodati njegovi minimalni meji, se določi glede na velikost frekvenc predhodnega in naslednjih intervalov. V tem primeru 100 dodamo 8,8, tj. več kot polovico intervala, ker je frekvenca predhodnega intervala manjša od frekvence naslednjega intervala.

Izračunajmo zdaj mediano. Da bi našli mediano v seriji intervalnih variacij, najprej določimo interval, v katerem se nahaja (interval mediane). Takšen interval bo tisti, katerega kumulativna frekvenca je enaka ali večja od polovice vsote frekvenc. Kumulativne frekvence se oblikujejo s postopnim seštevanjem frekvenc, začenši z intervalom z najnižjo vrednostjo atributa. Polovica vsote frekvenc je 250 (500:2). Zato bo v skladu s tabelo 3 srednji interval interval z vrednostjo plače 350.000 rubljev. do 400.000 rubljev.

Tabela 3. Izračun mediane v seriji intervalnih variacij

Pred tem intervalom je bila vsota akumuliranih frekvenc 160. Zato je za pridobitev mediane treba prišteti še 90 enot (250 – 160).

Recimo, da želite določiti povprečje v porazdelitvi rezultatov študentov ali v vzorcu podatkov o zagotavljanju kakovosti. Če želite to narediti, boste morali izračunati mediano niza števil z uporabo funkcije MEDIAN.

Ta funkcija je eden od načinov za merjenje osrednje tendence, to je lokacije središča niza števil v statistični porazdelitvi. Obstajajo trije najpogostejši načini za določitev osrednje tendence.

    Povprečna vrednost- to je vrednost, ki je aritmetična sredina, to pomeni, da se izračuna tako, da sešteje niz števil in nato deli dobljeno vsoto z njihovim številom. Na primer, povprečje števil 2, 3, 3, 5, 7 in 10 je 5 (rezultat deljenja vsote teh števil, ki je 30, z njihovim številom, ki je 6).

    Mediana- število, ki je sredina niza števil: polovica števil ima vrednosti, večje od mediane, polovica števil pa manjše vrednosti. Na primer, mediana za številke 2, 3, 3, 5, 7 in 10 bi bila 4.

    Moda- število, ki ga najpogosteje najdemo v danem nizu števil. Na primer, način za številke 2, 3, 3, 5, 7 in 10 bi bil 3.

S simetrično porazdelitvijo niza števil bodo vse tri vrednosti osrednje težnje sovpadale. Ko je porazdelitev številnih števil pristranska, so lahko vrednosti drugačne.

Posnetki zaslona v tem članku so iz programa Excel 2016. Če uporabljate drugo različico, bo vmesnik morda nekoliko drugačen, vendar bodo funkcije enake.

Primer

Za lažje razumevanje tega primera ga kopirajte na prazen list papirja.

Nasvet:Če želite preklopiti med ogledom rezultatov in ogledom formul, ki vrnejo te rezultate, pritisnite CTRL+` (apostrof) ali na zavihku Formule v skupini Odvisnosti formule kliknite gumb Prikaži formule.

Najnovejši materiali v razdelku:

Analiza zgodovinskega razvoja pojma »funkcionalna pismenost« Oblikovanje funkcionalne pismenosti
Analiza zgodovinskega razvoja pojma »funkcionalna pismenost« Oblikovanje funkcionalne pismenosti

BBK 60.521.2 A. A. Verjajev, M. N. Nečunaeva, G. V. Tatarnikova Funkcionalna pismenost učencev: ideje, kritična analiza, merjenje...

Prvi umetni satelit Zemlje Razredna ura o prvem satelitu
Prvi umetni satelit Zemlje Razredna ura o prvem satelitu

Tema: "Potovanje v vesolje." Cilji: razširiti znanje otrok o vesolju, slavnih astronavtih;

predstavi zgodovino nastanka rakete...
predstavi zgodovino nastanka rakete...

Katera morja umivajo najbolj suho celino?