Skewness dan kurtosis distribusi variabel acak. Perhitungan skewness dan kurtosis suatu distribusi empiris di Excel Koefisien Kurtosis berdistribusi normal

Koefisien asimetri menunjukkan “kecondongan” rangkaian distribusi relatif terhadap pusat:

dimana momen sentral orde ketiga;

– pangkat tiga simpangan baku.

Untuk cara perhitungan ini: jika , distribusinya bersisi kanan (asimetri positif), jika , distribusinya bersisi kiri (asimetri negatif)

Selain momen sentral, asimetri dapat dihitung menggunakan modus atau median:

atau , (6.69)

Untuk metode perhitungan ini: jika , distribusinya bersisi kanan (asimetri positif), jika , distribusinya bersisi kiri (asimetri negatif) (Gbr. 4).


Beras. 4. Distribusi asimetris

Nilai yang menunjukkan “kecuraman” distribusi disebut koefisien kurtosis:

Jika , di distribusinya ada ketajaman – kurtosis positif jika , diamati dalam distribusi kebosanan – kurtosis negatif (Gbr. 5).

Beras. 5. Distribusi yang berlebihan

Contoh 5. Terdapat data jumlah domba di peternakan di wilayah tersebut (Tabel 9).

1. Rata-rata jumlah domba per peternakan.

3. Median.

4. Indikator variasi

· penyebaran;

· standar deviasi;

· koefisien variasi.

5. Indikator asimetri dan kurtosis.

Larutan.

1. Karena nilai pilihan dalam agregat diulang beberapa kali, maka dengan frekuensi tertentu untuk menghitung nilai rata-rata kita menggunakan rumus rata-rata aritmatika tertimbang:

2. Rangkaian ini bersifat diskrit, sehingga mode akan menjadi pilihan dengan frekuensi tertinggi - .

3. Deret ini genap, dalam hal ini median suatu deret diskrit dicari dengan menggunakan rumus:

Artinya, separuh peternakan dalam populasi penelitian memiliki hingga 4,75 ribu ekor domba. dan setengahnya berada di atas angka ini.

4. Untuk menghitung indikator variasi, kita akan membuat tabel 10 yang didalamnya kita akan menghitung simpangan, kuadrat simpangan tersebut, perhitungannya dapat dilakukan dengan menggunakan rumus perhitungan sederhana dan tertimbang (pada contoh kita menggunakan yang sederhana satu):

Tabel 10

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
Total 53,00 0,00 34,42
Rata-rata 4,4167

Mari kita hitung variansnya:

Mari kita hitung deviasi standarnya:

Mari kita hitung koefisien variasi:

5. Untuk menghitung indikator asimetri dan kurtosis, kita akan membuat tabel 11 yang akan kita hitung , ,

Tabel 11

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
Total 53,00 0,00 0,11 142,98
Rata-rata 4,4167

Kemiringan distribusinya adalah:

Artinya, asimetri sisi kiri diamati, karena , yang dikonfirmasi ketika dihitung menggunakan rumus:

Dalam hal ini, rumus ini juga menunjukkan asimetri sisi kiri

Kurtosis distribusinya sama dengan:

Dalam kasus kami, kurtosisnya negatif, yaitu ada kerataan.

Contoh 6. Data upah pekerja disajikan untuk rumah tangga (Tabel 12)

Larutan.

Untuk deret variasi interval, modus dihitung menggunakan rumus:

Di mana interval modal – interval dengan frekuensi tertinggi, dalam kasus kami 3600-3800, dengan frekuensi

Batas interval modal minimum (3600);

Nilai interval modal (200);

Frekuensi interval sebelum interval modal (25);

Frekuensi mengikuti interval modal (29);

Frekuensi interval modal (68).

Tabel 12

Untuk deret variasi interval, median dihitung menggunakan rumus:

Di mana interval median ini adalah interval yang frekuensi kumulatifnya (akumulasi) sama dengan atau lebih besar dari setengah jumlah frekuensi, dalam contoh kita adalah 3600-3800.

Batas minimum interval median (3600);

Nilai interval median (200);

Jumlah frekuensi rangkaian (154);

Jumlah akumulasi frekuensi, semua interval sebelum median (57);

– frekuensi interval median (68).

Contoh 7. Untuk tiga peternakan di satu distrik, terdapat informasi tentang intensitas modal produksi (jumlah biaya modal tetap per 1 rubel produk yang dihasilkan): I – 1,29 rubel, II – 1,32 rubel, III – 1,27 rubel. Penting untuk menghitung intensitas modal rata-rata.

Larutan. Karena intensitas modal adalah indikator kebalikan dari perputaran modal, kami menggunakan rumus sederhana rata-rata harmonik.

Contoh 8. Untuk tiga peternakan di satu kabupaten, terdapat data panen gabah kotor dan hasil rata-rata (Tabel 13).

Larutan. Menghitung rata-rata hasil dengan menggunakan mean aritmatika tidak mungkin dilakukan, karena tidak ada informasi jumlah luas tanam, maka kita menggunakan rumus rata-rata harmonik tertimbang:

Contoh 9. Terdapat data rata-rata hasil kentang di masing-masing areal dan jumlah penimbunan (Tabel 14)

Tabel 14

Mari kita kelompokkan datanya (Tabel 15):

Tabel 15

Pengelompokan areal berdasarkan jumlah gulma

1. Hitung total varians sampel (Tabel 16).

Saat menganalisis deret variasi, perpindahan dari pusat dan kemiringan distribusi dicirikan oleh indikator khusus. Distribusi empiris biasanya bergeser dari pusat distribusi ke kanan atau kiri, dan bersifat asimetris. Distribusi normal sangat simetris terhadap mean aritmatika, yang disebabkan oleh paritas fungsinya.

Kemiringan distribusi muncul karena fakta bahwa beberapa faktor bertindak lebih kuat dalam satu arah daripada yang lain, atau proses perkembangan fenomena sedemikian rupa sehingga beberapa penyebab mendominasi. Selain itu, sifat beberapa fenomena sedemikian rupa sehingga terdapat distribusi yang asimetris.

Ukuran asimetri yang paling sederhana adalah selisih antara mean aritmatika, modus, dan median:

Untuk menentukan arah dan besarnya pergeseran (asimetri) sebaran dihitung koefisien asimetri , yang merupakan momen normalisasi orde ketiga:

As= 3 / 3, dimana  3 adalah momen sentral orde ketiga;  3 – standar deviasi pangkat tiga. 3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 .

Untuk asimetri sisi kiri koefisien asimetri (Sebagai<0), при правосторонней (As>0) .

Jika bagian atas sebaran digeser ke kiri dan bagian kanan cabang lebih panjang dari bagian kiri, maka asimetri tersebut adalah sisi kanan, jika tidak kidal .

Hubungan antara modus, median, dan mean aritmatika pada deret simetris dan asimetris memungkinkan kita menggunakan indikator yang lebih sederhana sebagai ukuran asimetri. koefisien asimetri Pearson :

Ka = ( –Mo)/. Jika K a >0, maka asimetrinya bersisi kanan, jika K a<0, то асимметрия левосторонняя, при К a =0 ряд считается симметричным.

Asimetri dapat ditentukan secara lebih akurat menggunakan momen pusat orde ketiga:

, dimana 3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 .

Jika > 0, maka asimetri tersebut dianggap signifikan jika < 0,25 асимметрию можно считать не значительной.

Untuk mengkarakterisasi derajat penyimpangan suatu distribusi simetris dari distribusi normal sepanjang ordinat, digunakan indikator puncak, kecuraman distribusi, yang disebut kelebihan :

Contoh = ( 4 / 4) – 3, dimana:  4 – momen sentral orde keempat.

Untuk distribusi normal, Ex = 0, yaitu.  4 / 4 = 3.  4 = (m 4 – 4m 3 m 1 + 6m 2 m 2 1 – 3 m 4 1)* k 4 .

Kurva dengan puncak tinggi mempunyai kurtosis positif, sedangkan kurva dengan puncak rendah mempunyai kurtosis negatif (Gambar D.2).

Indikator kurtosis dan skewness diperlukan dalam analisis statistik untuk mengetahui heterogenitas populasi, asimetri sebaran, dan kedekatan sebaran empiris terhadap hukum normal. Dengan penyimpangan indikator asimetri dan kurtosis yang signifikan dari nol, populasi tidak dapat dianggap homogen dan distribusinya mendekati normal. Perbandingan kurva aktual dengan kurva teoritis memungkinkan seseorang untuk secara matematis mendukung hasil statistik yang diperoleh, menetapkan jenis dan sifat sebaran fenomena sosial ekonomi, dan memprediksi kemungkinan terjadinya peristiwa yang diteliti.

4.7. Justifikasi kedekatan distribusi empiris (aktual) dengan distribusi normal teoritis. Distribusi normal (hukum Gauss-Laplace) dan ciri-cirinya. "Aturan Tiga Sigma." Kriteria goodness-of-fit (menggunakan contoh kriteria Pearson atau Kolgomogorov).

Anda dapat melihat hubungan tertentu dalam perubahan frekuensi dan nilai karakteristik yang bervariasi. Ketika nilai atribut meningkat, frekuensinya pertama-tama meningkat dan kemudian, setelah mencapai nilai maksimum tertentu, menurun. Perubahan frekuensi yang teratur dalam deret variasi disebut pola distribusi.

Untuk mengidentifikasi suatu pola sebaran, rangkaian variasi perlu memuat jumlah unit yang cukup besar, dan rangkaian itu sendiri harus mewakili populasi yang secara kualitatif homogen.

Poligon distribusi yang dibangun berdasarkan data aktual adalah kurva distribusi empiris (aktual)., mencerminkan tidak hanya kondisi sebaran obyektif (umum), tetapi juga subyektif (acak) yang bukan merupakan ciri dari fenomena yang diteliti.

Dalam kerja praktek, hukum distribusi ditemukan dengan membandingkan distribusi empiris dengan salah satu distribusi teoritis dan menilai derajat perbedaan atau kesesuaian di antara keduanya. Kurva distribusi teoritis mencerminkan dalam bentuknya yang murni, tanpa memperhitungkan pengaruh faktor acak, pola umum distribusi frekuensi (kepadatan distribusi) tergantung pada nilai karakteristik yang bervariasi.

Berbagai jenis distribusi teoretis yang umum dalam statistik: normal, binomial, Poisson, dll. Masing-masing distribusi teoretis memiliki kekhasan dan ruang lingkupnya masing-masing.

Hukum distribusi normal karakteristik distribusi peristiwa-peristiwa yang kemungkinannya sama terjadi selama interaksi banyak faktor acak. Hukum distribusi normal mendasari metode statistik untuk memperkirakan parameter distribusi, keterwakilan pengamatan sampel, dan mengukur hubungan fenomena massa. Untuk memeriksa seberapa sesuai distribusi aktual dengan distribusi normal, perlu membandingkan frekuensi distribusi aktual dengan frekuensi teoritis yang merupakan ciri hukum distribusi normal. Frekuensi-frekuensi ini merupakan fungsi dari deviasi yang dinormalisasi. Oleh karena itu, berdasarkan data deret distribusi empiris, deviasi ternormalisasi t dihitung. Kemudian frekuensi teoritis yang sesuai ditentukan. Hal ini meratakan distribusi empiris.

Distribusi normal atau hukum Gauss-Laplace dijelaskan dengan persamaan
, dimana y t adalah ordinat kurva distribusi normal, atau frekuensi (probabilitas) nilai x distribusi normal; – ekspektasi matematis (nilai rata-rata) dari nilai x individu. Jika nilai (x – ) mengukur (menyatakan) dalam bentuk simpangan baku , yaitu. dalam deviasi standar (dinormalisasi) t = (x – )/, maka rumusnya akan berbentuk:
. Sebaran normal fenomena sosial ekonomi dalam bentuknya yang murni jarang terjadi, namun jika homogenitas penduduk tetap terjaga, sebaran sebenarnya seringkali mendekati normal. Pola sebaran besaran yang diteliti diketahui dengan memeriksa kesesuaian distribusi empiris dengan hukum distribusi normal teoritis. Untuk melakukan ini, distribusi aktual disejajarkan dengan kurva normal dan dihitung kriteria persetujuan .

Distribusi normal dicirikan oleh dua parameter penting yang menentukan pusat pengelompokan nilai individu dan bentuk kurva: mean aritmatika dan simpangan baku . Kurva distribusi normal berbeda pada posisi pusat distribusi pada sumbu x dan opsi sebar di sekitar pusat ini  (Gbr. 4.1 dan 4.2). Ciri kurva distribusi normal adalah simetrinya relatif terhadap pusat distribusi - di kedua sisi tengahnya, terbentuk dua cabang yang menurun secara seragam, mendekati sumbu absis secara asimtotik. Oleh karena itu, pada distribusi normal, mean, modus, dan median adalah sama: = Mo = Saya.

  X

Kurva distribusi normal mempunyai dua titik belok (peralihan dari konveksitas ke cekung) pada t = 1, yaitu. ketika opsi menyimpang dari rata-rata (x – ), sama dengan simpangan baku . Di dalam  dengan distribusi normal 68,3%, dalam 2 – 95,4%, dalam 3 – 99,7% dari jumlah observasi atau frekuensi rangkaian distribusi. Dalam praktiknya, hampir tidak ada penyimpangan yang melebihi 3oleh karena itu, hubungan yang diberikan disebut “ aturan tiga sigma ».

Untuk menghitung frekuensi teoritis digunakan rumus:

.

Besarnya
adalah fungsi dari t atau massa jenis berdistribusi normal, yang ditentukan dari tabel khusus, kutipannya diberikan dalam tabel. 4.2.

Nilai kepadatan sebaran normal Tabel 4.2

Grafik pada Gambar. 4.3 dengan jelas menunjukkan keeratan distribusi empiris (2) dan normal (1).

Beras. 4.3. Distribusi cabang layanan pos berdasarkan nomor

pekerja: 1 – normal; 2 – empiris

Untuk membuktikan secara matematis kedekatan distribusi empiris dengan hukum distribusi normal, hitunglah kriteria persetujuan .

Kriteria Kolmogorov - kriteria kesesuaian yang memungkinkan seseorang menilai tingkat kedekatan distribusi empiris ke normal. A. N. Kolmogorov mengusulkan untuk menggunakan perbedaan maksimum antara akumulasi frekuensi atau frekuensi deret ini untuk menentukan korespondensi antara distribusi normal empiris dan teoritis. Untuk menguji hipotesis bahwa distribusi empiris sesuai dengan hukum distribusi normal, kriteria goodness-of-fit = D/ dihitung
, dimana D adalah selisih maksimum antara frekuensi kumulatif (akumulasi) empiris dan teoritis, n adalah jumlah unit dalam populasi.Dengan menggunakan tabel khusus, P() ditentukan - peluang tercapainya , yang artinya jika suatu karakteristik variasional didistribusikan menurut hukum normal, maka Untuk alasan acak, perbedaan maksimum antara frekuensi akumulasi empiris dan teoritis tidak akan kurang dari frekuensi yang sebenarnya diamati. Berdasarkan nilai P(), diambil kesimpulan tertentu: jika probabilitas P() cukup besar, maka hipotesis bahwa distribusi aktual sesuai dengan hukum normal dapat dianggap terkonfirmasi; jika probabilitas P() kecil, maka hipotesis nol ditolak, dan perbedaan antara distribusi aktual dan teoritis dianggap signifikan.

Nilai probabilitas kriteria goodness-of-fit  Tabel 4.3

kriteria Pearson 2 (“chi-kuadrat”) - kriteria kesesuaian yang memungkinkan seseorang menilai tingkat kedekatan distribusi empiris dengan normal:
,di mana f i, f" i adalah frekuensi distribusi empiris dan teoritis dalam interval tertentu. Semakin besar perbedaan antara frekuensi observasi dan teoritis, semakin besar kriteria  2. Untuk membedakan signifikansi perbedaan frekuensi distribusi distribusi empiris dan teoritis menurut kriteria  2 dari perbedaan karena sampel kebetulan, nilai perhitungan kriteria  2 kal dibandingkan dengan tabel tabulasi  2 dengan jumlah derajat kebebasan yang sesuai dan tingkat signifikansi tertentu. level dipilih sehingga P( 2 kal > 2 tab) = . Banyaknya derajat kebebasan adalah Haku, Di mana H– jumlah kelompok; aku– jumlah kondisi yang harus dipenuhi saat menghitung frekuensi teoritis. Untuk menghitung frekuensi teoritis kurva distribusi normal menggunakan rumus
Anda perlu mengetahui tiga parameter , , f, maka banyaknya derajat kebebasannya adalah h–3. Jika  2 kal > 2 tab, mis.  2 termasuk dalam wilayah kritis, maka perbedaan antara frekuensi empiris dan teoritis adalah signifikan dan tidak dapat dijelaskan oleh fluktuasi acak dalam data sampel. Dalam hal ini hipotesis nol ditolak. Jika  2 perhitungan  2 tabel, mis. kriteria yang dihitung tidak melebihi kemungkinan divergensi frekuensi maksimum yang mungkin timbul karena kebetulan, maka dalam hal ini hipotesis tentang kesesuaian distribusi diterima. Kriteria Pearson efektif dengan jumlah observasi yang signifikan (n50), dan frekuensi semua interval harus berjumlah minimal lima satuan (dengan jumlah yang lebih kecil, interval digabungkan), dan jumlah interval (grup) harus menjadi besar (h>5), karena perkiraan  2 bergantung pada jumlah derajat kebebasan.

Kriteria Romanovsky - kriteria kesesuaian yang memungkinkan seseorang menilai tingkat kedekatan distribusi empiris ke normal. Romanovsky mengusulkan untuk mengevaluasi kedekatan distribusi empiris dengan kurva distribusi normal sehubungan dengan:

, di mana h adalah jumlah grup.

Jika rasionya lebih besar dari 3, maka selisih antara frekuensi distribusi empiris dan normal tidak dapat dianggap acak dan hipotesis hukum distribusi normal harus ditolak. Jika rasionya kurang dari atau sama dengan 3, maka hipotesis bahwa sebaran datanya normal dapat diterima.

Untuk memperoleh gambaran perkiraan tentang bentuk sebaran suatu variabel acak, dibuat grafik deret distribusinya (poligon dan histogram), fungsi atau kepadatan distribusi. Dalam praktik penelitian statistik, kita menjumpai distribusi yang sangat berbeda. Populasi homogen biasanya dicirikan oleh distribusi titik tunggal. Multivertex menunjukkan heterogenitas populasi yang diteliti. Dalam hal ini perlu dilakukan pengelompokan kembali data untuk mengidentifikasi kelompok yang lebih homogen.

Penentuan sifat umum sebaran suatu variabel acak melibatkan penilaian derajat homogenitasnya, serta perhitungan indikator asimetri dan kurtosis. Dalam distribusi simetris, yang ekspektasi matematisnya sama dengan median, yaitu. , dapat dianggap tidak ada asimetri. Namun semakin terlihat asimetrinya, semakin besar deviasi antara karakteristik pusat distribusi - ekspektasi matematis dan median.

Koefisien asimetri distribusi variabel acak yang paling sederhana dapat dipertimbangkan , dimana adalah ekspektasi matematis, adalah median, dan merupakan simpangan baku dari variabel acak.

Dalam kasus asimetri sisi kanan, asimetri sisi kiri. Jika , asimetri dianggap rendah, jika - sedang, dan tinggi. Ilustrasi geometri asimetri sisi kanan dan kiri ditunjukkan pada gambar di bawah. Ini menunjukkan grafik kepadatan distribusi jenis variabel acak kontinu yang sesuai.

Menggambar. Ilustrasi asimetri sisi kanan dan kiri pada plot kepadatan distribusi variabel acak kontinu.

Ada lagi koefisien asimetri distribusi variabel acak. Dapat dibuktikan bahwa momen sentral yang bukan nol berorde ganjil menunjukkan adanya asimetri sebaran peubah acak. Pada indikator sebelumnya kita menggunakan ekspresi yang mirip dengan momen order pertama. Namun biasanya pada koefisien asimetri lain ini digunakan momen sentral orde ketiga , dan agar koefisien ini menjadi tidak berdimensi, koefisien tersebut dibagi dengan pangkat tiga simpangan baku. Koefisien asimetri yang dihasilkan adalah: . Untuk koefisien asimetri ini, seperti yang pertama dalam kasus asimetri sisi kanan, sisi kiri - .

Kurtosis variabel acak

Kurtosis distribusi suatu variabel acak mencirikan derajat konsentrasi nilainya di dekat pusat distribusi: semakin tinggi konsentrasinya, semakin tinggi dan sempit grafik kepadatan distribusinya. Indikator kurtosis (ketajaman) dihitung dengan rumus : , dimana adalah momen sentral orde ke-4, dan merupakan deviasi standar yang dipangkatkan ke-4. Karena pangkat pembilang dan penyebutnya sama, maka kurtosis termasuk besaran tak berdimensi. Dalam hal ini diterima sebagai standar tidak adanya kurtosis, kurtosis nol, untuk mengambil distribusi normal. Namun dapat dibuktikan bahwa untuk berdistribusi normal. Oleh karena itu, dalam rumus menghitung kurtosis, angka 3 dikurangkan dari pecahan ini.

Jadi, untuk distribusi normal kurtosisnya adalah nol: . Jika kurtosis lebih besar dari nol, mis. , maka distribusinya lebih memuncak dari biasanya. Jika kurtosis kurang dari nol, mis. , maka distribusinya kurang memuncak dari biasanya. Nilai pembatas kurtosis negatif adalah nilai ; besarnya kurtosis positif bisa sangat besar. Seperti apa grafik kepadatan distribusi variabel acak dengan puncak dan puncak datar dibandingkan dengan distribusi normal ditunjukkan pada gambar.

Menggambar. Ilustrasi distribusi kepadatan variabel acak yang memuncak dan datar dibandingkan dengan distribusi normal.

Asimetri dan kurtosis sebaran suatu variabel acak menunjukkan seberapa besar penyimpangannya dari hukum normal. Untuk asimetri dan kurtosis yang besar, rumus perhitungan distribusi normal tidak boleh digunakan. Berapa tingkat diterimanya asimetri dan kurtosis untuk penggunaan rumus distribusi normal dalam analisis data untuk variabel acak tertentu harus ditentukan oleh peneliti berdasarkan pengetahuan dan pengalamannya.

Definisi. Mode M 0 dari variabel acak diskrit disebut nilai yang paling mungkin. Untuk variabel acak kontinu, modus adalah nilai variabel acak yang kepadatan distribusinya maksimum.

Jika poligon distribusi suatu variabel acak diskrit atau kurva distribusi suatu variabel acak kontinu mempunyai dua atau lebih maksimum, maka distribusi tersebut disebut bimodal atau multimodal.

Jika suatu distribusi mempunyai minimum tetapi tidak ada maksimum, maka disebut antimodal.

Definisi. median M D dari suatu variabel acak X adalah nilainya relatif terhadap kemungkinan besar diperolehnya nilai yang lebih besar atau lebih kecil dari variabel acak tersebut.

Secara geometris, median adalah absis suatu titik dimana luas yang dibatasi oleh kurva distribusi dibagi dua.

Perhatikan bahwa jika distribusinya unimodal, maka modus dan mediannya bertepatan dengan ekspektasi matematis.

Definisi. Momen awal memesan k variabel acak X adalah ekspektasi matematis dari nilai X k .

Untuk variabel acak diskrit: .

.

Momen awal orde pertama sama dengan ekspektasi matematis.

Definisi. Momen sentral memesan k variabel acak X adalah ekspektasi matematis dari nilai tersebut

Untuk variabel acak diskrit: .

Untuk variabel acak kontinu: .

Momen sentral orde pertama selalu nol, dan momen sentral orde kedua sama dengan dispersi. Momen sentral orde ketiga mencirikan asimetri distribusi.

Definisi. Perbandingan momen sentral orde ketiga dengan simpangan baku pangkat ketiga disebut koefisien asimetri.

Definisi. Untuk mengkarakterisasi puncak dan kerataan distribusi, suatu besaran disebut kelebihan.

Selain besaran yang dipertimbangkan, momen absolut juga digunakan:

Momen awal mutlak: .

Titik sentral mutlak: .

Kuantil , sesuai dengan tingkat probabilitas tertentu R, adalah nilai dimana fungsi distribusi mengambil nilai yang sama R, yaitu. Di mana R- tingkat probabilitas tertentu.

Dengan kata lain kuantil ada nilai variabel acak di mana

Kemungkinan R, ditentukan dalam persentase, memberi nama pada kuantil yang bersangkutan, misalnya disebut kuantil 40%.

20. Ekspektasi matematis dan dispersi banyaknya kemunculan suatu peristiwa dalam eksperimen mandiri.

Definisi. Harapan matematis variabel acak kontinu X, yang nilai-nilainya mungkin termasuk dalam segmen tersebut , disebut integral tertentu

Jika nilai yang mungkin dari suatu variabel acak dipertimbangkan pada seluruh sumbu numerik, maka ekspektasi matematisnya ditemukan dengan rumus:

Dalam hal ini tentu saja integral tak wajar diasumsikan konvergen.

Harapan matematis Variabel acak diskrit adalah jumlah produk dari nilai yang mungkin dan probabilitas yang sesuai:

M(X) =X 1 R 1 +X 2 R 2 + … +X P R P . (7.1)

Jika jumlah nilai yang mungkin dari suatu variabel acak tidak terbatas, maka
, jika deret yang dihasilkan konvergen mutlak.

Catatan 1. Ekspektasi matematis kadang-kadang disebut rata-rata tertimbang, karena kira-kira sama dengan rata-rata aritmatika dari nilai pengamatan variabel acak dalam sejumlah besar percobaan.

Catatan 2. Dari definisi ekspektasi matematis dapat disimpulkan bahwa nilainya tidak kurang dari nilai terkecil yang mungkin dari suatu variabel acak dan tidak lebih dari nilai terbesar.

Catatan 3. Ekspektasi matematis dari variabel acak diskrit adalah tidak acak(konstan. Nanti kita akan melihat bahwa hal yang sama juga berlaku untuk variabel acak kontinu.

Sifat ekspektasi matematis.

    Ekspektasi matematis suatu konstanta sama dengan konstanta itu sendiri:

M(DENGAN) =DENGAN.(7.2)

Bukti. Jika kita mempertimbangkan DENGAN sebagai variabel acak diskrit yang hanya mengambil satu nilai DENGAN dengan probabilitas R= 1, maka M(DENGAN) =DENGAN·1 = DENGAN.

    Faktor konstanta dapat dikeluarkan dari tanda ekspektasi matematis:

M(CX) =CM(X). (7.3)

Bukti. Jika variabel acak X diberikan berdasarkan seri distribusi

X Saya

X N

P Saya

P N

kemudian seri distribusi untuk CX memiliki bentuk:

DENGANX Saya

DENGANX 1

DENGANX 2

DENGANX N

P Saya

P N

Kemudian M(CX) =Cx 1 R 1 +Cx 2 R 2 + … +Cx P R P =DENGAN(X 1 R 1 +X 2 R 2 + … +X P R P) =CM(X).

Harapan matematis variabel acak kontinu disebut

(7.13)

Catatan 1. Definisi umum varians untuk variabel acak kontinu tetap sama dengan variabel diskrit (def. 7.5), dan rumus untuk menghitungnya berbentuk:

(7.14)

Simpangan baku dihitung menggunakan rumus (7.12).

Catatan 2. Jika semua nilai yang mungkin dari variabel acak kontinu tidak berada di luar interval [ A, B], maka integral dalam rumus (7.13) dan (7.14) dihitung dalam batas tersebut.

Dalil. Varians banyaknya terjadinya suatu peristiwa dalam percobaan bebas sama dengan hasil kali banyaknya percobaan dan peluang terjadinya dan tidak terjadinya suatu peristiwa dalam satu percobaan: .

Bukti. Misalkan adalah banyaknya kemunculan peristiwa tersebut dalam percobaan bebas. Ini sama dengan jumlah kemunculan kejadian di setiap percobaan: . Karena tesnya independen, variabel acaknya – oleh karena itu mandiri.

Seperti yang ditunjukkan di atas, , dan .

Lalu ah .

Dalam hal ini, seperti disebutkan sebelumnya, simpangan bakunya adalah.

Saat menganalisis sebaran penduduk, yang menarik adalah penilaian penyimpangan suatu sebaran tertentu dari simetris, atau, dengan kata lain, kecondongannya. Derajat kecondongan (asimetri) merupakan salah satu sifat terpenting dari sebaran penduduk. Ada sejumlah statistik yang dirancang untuk menghitung asimetri. Semuanya memenuhi setidaknya dua persyaratan untuk setiap indikator kemiringan: harus tidak berdimensi dan sama dengan nol jika distribusinya simetris.

Pada Gambar. 2 a, b menunjukkan kurva dua sebaran penduduk asimetris, yang satu miring ke kiri dan yang lainnya miring ke kanan. Posisi relatif modus, median dan mean ditampilkan secara kualitatif. Terlihat bahwa salah satu indikator skewness yang mungkin dapat dibuat dengan mempertimbangkan jarak letak mean dan mode satu sama lain. Namun dengan mempertimbangkan kompleksitas penentuan modus dari data empiris, dan sebaliknya hubungan yang diketahui (3) antara modus, median dan rata-rata, maka diusulkan rumus berikut untuk menghitung indeks asimetri:

Dari rumus ini dapat disimpulkan bahwa distribusi yang condong ke kiri mempunyai kecondongan positif, dan distribusi yang condong ke kanan mempunyai kecondongan negatif. Secara alami, untuk distribusi simetris, yang mean dan mediannya sama, asimetrinya adalah nol.

Mari kita hitung indikator asimetri untuk data yang diberikan dalam tabel. 1 dan 2. Untuk distribusi durasi siklus jantung kita mempunyai:

Dengan demikian, distribusi ini sedikit condong ke kiri. Nilai asimetri yang diperoleh merupakan perkiraan dan tidak eksak, karena nilai yang dihitung dengan cara yang disederhanakan digunakan untuk menghitungnya.

Untuk distribusi gugus sulfhidril dalam serum darah kita mempunyai:

Dengan demikian, distribusi ini memiliki kecondongan negatif, yaitu. miring ke kanan.

Secara teoritis terlihat bahwa nilai yang ditentukan oleh rumus 13 terletak di dalam 3. Namun dalam praktiknya, nilai ini sangat jarang mencapai nilai batasnya, dan untuk distribusi titik tunggal asimetris sedang, nilai absolutnya biasanya kurang dari satu.

Indikator asimetri dapat digunakan tidak hanya untuk gambaran formal sebaran penduduk, tetapi juga untuk interpretasi yang bermakna atas data yang diperoleh.

Faktanya, jika karakteristik yang kita amati terbentuk di bawah pengaruh sejumlah besar penyebab yang independen satu sama lain, yang masing-masing memberikan kontribusi yang relatif kecil terhadap nilai karakteristik tersebut, maka sesuai dengan beberapa premis teoritis yang dibahas dalam artikel. bagian teori probabilitas, kita berhak mengharapkan bahwa distribusi populasi yang diperoleh dari percobaan akan simetris. Namun, jika nilai asimetri yang signifikan diperoleh untuk data eksperimen (nilai numerik As modulo berada dalam sepersepuluh), maka dapat diasumsikan bahwa kondisi yang ditentukan di atas tidak terpenuhi.

Dalam hal ini, masuk akal untuk mengasumsikan keberadaan satu atau dua faktor, yang kontribusinya terhadap pembentukan nilai yang diamati dalam eksperimen jauh lebih besar daripada faktor lainnya, atau mendalilkan adanya mekanisme khusus yaitu berbeda dengan mekanisme pengaruh independen banyak sebab terhadap nilai karakteristik yang diamati.

Jadi, misalnya, jika perubahan kuantitas yang kita minati, yang berkaitan dengan aksi suatu faktor tertentu, sebanding dengan nilai itu sendiri dan intensitas aksi penyebabnya, maka distribusi yang dihasilkan akan selalu condong ke arah kiri, yaitu mempunyai kecondongan yang positif. Ahli biologi, misalnya, menemukan mekanisme seperti itu ketika memperkirakan jumlah yang terkait dengan pertumbuhan tumbuhan dan hewan.

Cara lain untuk menilai skewness adalah berdasarkan metode momen yang akan dibahas pada Bab 44. Sesuai dengan metode ini, skewness dihitung dengan menggunakan jumlah simpangan seluruh nilai suatu rangkaian data relatif terhadap rata-rata. , dipangkatkan ketiga, yaitu:

Pangkat ketiga memastikan bahwa pembilang persamaan ini sama dengan nol untuk distribusi simetris, karena dalam hal ini jumlah simpangan naik turun dari rata-rata ke pangkat ketiga akan sama dan mempunyai tanda yang berlawanan. Membagi dengan memberikan ketiadaan dimensi untuk ukuran asimetri.

Rumus (14) dapat diubah sebagai berikut. Pada paragraf sebelumnya, nilai-nilai standar diperkenalkan:

Jadi, ukuran skewness adalah rata-rata dari data standar yang dikubuskan.

Untuk data yang sama yang asimetrinya dihitung menggunakan rumus (13), kita mencari indikatornya menggunakan rumus (15). Kita punya:

Secara alami, indikator asimetri yang dihitung dengan menggunakan rumus yang berbeda besarnya berbeda satu sama lain, tetapi sama-sama menunjukkan sifat kemiringannya. Dalam paket aplikasi analisis statistik, saat menghitung asimetri, digunakan rumus (15) karena memberikan nilai yang lebih akurat. Untuk perhitungan awal menggunakan kalkulator sederhana dapat menggunakan rumus (13).

Kelebihan. Jadi, kami telah memeriksa tiga dari empat kelompok indikator yang dapat digunakan untuk menggambarkan distribusi populasi. Yang terakhir adalah sekelompok indikator peakiness, atau kurtosis (dari bahasa Yunani - bungkuk). Untuk menghitung salah satu kemungkinan indikator kurtosis digunakan rumus sebagai berikut:

Dengan menggunakan pendekatan yang sama yang diterapkan ketika mengubah rumus asimetri (14), mudah untuk menunjukkan bahwa:

Secara teoritis ditunjukkan bahwa nilai kurtosis untuk kurva distribusi normal (Gaussian), yang berperan besar dalam statistik, maupun dalam teori probabilitas, secara numerik sama dengan 3. Berdasarkan beberapa pertimbangan, ketajaman Kurva ini diambil sebagai standar, oleh karena itu sebagai indikator kurtosis gunakan nilai:

Mari kita cari nilai puncak untuk data yang diberikan dalam tabel. 1. Kami memiliki:

Dengan demikian, kurva distribusi durasi siklus jantung menjadi datar dibandingkan dengan kurva normalnya.

Di meja Gambar 3 menunjukkan sebaran jumlah bunga marginal pada salah satu jenis bunga krisan. Untuk distribusi ini

Kurtosis dapat memiliki nilai yang sangat besar, seperti terlihat dari contoh yang diberikan, namun batas bawahnya tidak boleh kurang dari satu. Ternyata jika distribusinya bimodal maka nilai kurtosis mendekati batas bawahnya sehingga cenderung -2. Dengan demikian, jika dari hasil perhitungan ternyata nilainya kurang dari -1-1,4, maka dapat dipastikan sebaran penduduk yang kita miliki setidaknya bersifat bimodal. Hal ini sangat penting untuk diperhatikan ketika data eksperimen, melewati tahap pra-pemrosesan, dianalisis menggunakan komputer digital dan peneliti tidak memiliki representasi grafis langsung dari distribusi populasi di depan matanya.

Kurva distribusi data eksperimen dua puncak dapat muncul karena berbagai alasan. Secara khusus, distribusi seperti itu dapat muncul dengan menggabungkan dua kumpulan data heterogen menjadi satu kumpulan. Untuk mengilustrasikannya, kami secara artifisial menggabungkan data lebar cangkang dua jenis fosil moluska menjadi satu set (Tabel 4, Gambar 3).

Gambar tersebut dengan jelas menunjukkan adanya dua mode, karena dua kumpulan data dari populasi berbeda digabungkan. Perhitungan tersebut menghasilkan nilai kurtosis 1,74, sehingga = -1,26. Dengan demikian, nilai indeks puncak yang dihitung menunjukkan, sesuai dengan posisi yang disebutkan sebelumnya, bahwa sebarannya mempunyai dua puncak.

Ada satu peringatan di sini. Memang benar, dalam semua kasus ketika sebaran penduduk mempunyai dua maksima, nilai kurtosisnya akan mendekati kesatuan. Namun fakta ini tidak serta merta dapat menyimpulkan bahwa kumpulan data yang dianalisis merupakan campuran dari dua sampel yang heterogen. Pertama, campuran seperti itu, tergantung pada jumlah agregat penyusunnya, mungkin tidak memiliki dua puncak, dan indeks kurtosis akan jauh lebih besar dari satu. Kedua, sampel yang homogen dapat memiliki dua mode jika, misalnya, persyaratan pemilihan data eksperimen dilanggar. Jadi, dalam hal ini, seperti dalam kasus lain, setelah perhitungan formal berbagai statistik, analisis profesional yang menyeluruh harus dilakukan, yang akan memungkinkan data yang diperoleh diberikan interpretasi yang bermakna.

Materi terbaru di bagian:

Elemen bakteri.  Struktur sel bakteri
Elemen bakteri. Struktur sel bakteri

Komponen struktur sel bakteri dibagi menjadi 2 jenis: - struktur dasar (dinding sel, membran sitoplasma beserta turunannya,...

Gerakan rotasi tubuh
Gerakan rotasi tubuh

1.8. Momen momentum suatu benda terhadap suatu sumbu. Momentum sudut suatu benda padat relatif terhadap suatu sumbu adalah jumlah momentum sudut masing-masing partikel, dari...

Pertempuran Perang Dunia II
Pertempuran Perang Dunia II

Di Stalingrad, jalannya dunia mengalami perubahan tajam.Dalam sejarah militer Rusia, pertempuran Stalingrad selalu dianggap sebagai pertempuran yang paling menonjol dan...