確率変数の分布の歪度と尖度。 Excel での経験的分布の歪度と尖度の計算 正規分布の尖度係数

非対称係数中心に対する分布系列の「歪度」を示します。

ここで、 は 3 次の中心モーメントです。

– 標準偏差の 3 乗。

この計算方法の場合: の場合、分布は右側 (正の非対称)、 の場合、分布は左側 (負の非対称)

中心モーメントに加えて、モードまたは中央値を使用して非対称性を計算できます。

または、 (6.69)

この計算方法の場合: の場合、分布は右側 (正の非対称)、 の場合、分布は左側 (負の非対称) になります (図 4)。


米。 4. 非対称分布

分布の「急峻さ」を示す値を といいます。 尖度係数:

の場合、ディストリビューションに とがった – 分布内に が観察される場合、尖度は正です。 平坦度 – 尖度はマイナスです (図 5)。

米。 5. 過剰分配

例5。この地域の農場の羊の数に関するデータがあります (表 9)。

1. 農場あたりの羊の平均頭数。

3. 中央値。

4. 変動指標

・分散。

・ 標準偏差;

· 変動係数。

5. 非対称性と尖度の指標。

解決。

1. 集計内のオプションの値は一定の頻度で複数回繰り返されるため、平均値を計算するために加重算術平均の式を使用します。

2. このシリーズは離散型であるため、モードは最高周波数のオプションになります - 。

3. この系列は偶数です。この場合、離散系列の中央値は次の式を使用して求められます。

つまり、研究対象集団の半数の農場では最大 475,000 頭の羊が飼育されています。 そして半数はこの数値を上回っています。

4. 変動指標を計算するには、表 10 を作成します。この表では、偏差とこれらの偏差の 2 乗を計算します。計算は、単純な計算式と加重計算式の両方を使用して実行できます (この例では、単純な計算式を使用しています)。 1つ):

表10

2,00 -2,42 5,84
2,50 -1,92 3,67
2,50 -1,92 3,67
3,00 -1,42 2,01
3,00 -1,42 2,01
4,00 -0,42 0,17
5,50 1,08 1,17
5,50 1,08 1,17
5,50 1,08 1,17
6,00 1,58 2,51
6,50 2,08 4,34
7,00 2,58 6,67
合計 53,00 0,00 34,42
平均 4,4167

分散を計算してみましょう。

標準偏差を計算してみましょう。

変動係数を計算してみましょう。

5. 非対称性と尖度の指標を計算するために、表 11 を作成します。その中で、 、 、 を計算します。

表11

2,00 -2,42 -14,11 34,11
2,50 -1,92 -7,04 13,50
2,50 -1,92 -7,04 13,50
3,00 -1,42 -2,84 4,03
3,00 -1,42 -2,84 4,03
4,00 -0,42 -0,07 0,03
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
5,50 1,08 1,27 1,38
6,00 1,58 3,97 6,28
6,50 2,08 9,04 18,84
7,00 2,58 17,24 44,53
合計 53,00 0,00 0,11 142,98
平均 4,4167

分布の歪度は次のとおりです。

つまり、 であるため、左側の非対称が観察されます。これは、次の式を使用して計算すると確認されます。

この場合、この式のどれも左側非対称を示します

分布の尖度は次のようになります。

この場合、尖度は負であり、平坦性が観察されます。

例6。 労働者の賃金に関するデータは世帯別に示されている(表 12)。

解決。

間隔変動系列の場合、最頻値は次の式を使用して計算されます。

どこ モーダルインターバル – 最も高い頻度の間隔、この場合は 3600 ~ 3800、頻度

最小モーダル間隔制限 (3600)。

モーダル間隔値 ​​(200);

モーダル区間に先行する区間周波数 (25);

モーダル間隔に従う周波数 (29);

モーダル間隔周波数 (68)。

表12

間隔変動系列の場合、中央値は次の式を使用して計算されます。

どこ 中央値間隔 これは、累積 (累積) 頻度が頻度の合計の半分以上である間隔であり、この例では 3600 ~ 3800 です。

中央値間隔の最小制限 (3600)。

間隔の中央値 (200);

系列の度数の合計 (154);

中央値に先行するすべての間隔の累積頻度の合計 (57)。

– 中央間隔の頻度 (68)。

例7。 1 つの地区にある 3 つの農場について、生産の資本集約度 (生産された製品 1 ルーブルあたりの固定資本コストの額) に関する情報があります: I – 1.29 ルーブル、II – 1.32 ルーブル、III – 1.27 ルーブル。 平均資本集約度を計算する必要がある。

解決。 資本強度は資本回転率の逆指標であるため、調和平均の単純な公式を使用します。

例8。 1 つの地区の 3 つの農場について、穀物の総収穫量と平均収量に関するデータがあります (表 13)。

解決。 播種面積の数に関する情報がないため、算術平均を使用して平均収量を計算することは不可能であるため、加重調和平均の式を使用します。

例9。各地域のジャガイモの平均収量と畝の数に関するデータがあります (表 14)。

表14

データをグループ化しましょう (表 15):

表15

除草回数に基づいてエリアをグループ化

1. サンプルの合計分散を計算します (表 16)。

変動系列を分析する場合、中心からの変位と分布の傾きは特別な指標によって特徴付けられます。 経験的な分布は、通常、分布の中心から右または左にシフトしており、非対称です。 正規分布は算術平均に関して厳密に対称ですが、これは関数のパリティによるものです。

分布の歪度 いくつかの要因が別の方向よりもある方向に強く作用するという事実、または現象の発展過程で何らかの原因が支配的であるという事実によって発生します。 さらに、一部の現象の性質上、非対称な分布が存在します。

非対称性の最も単純な尺度は、算術平均、最頻値、中央値の差です。

分布のシフト (非対称性) の方向と大きさを決定するには、次のように計算します。 非対称係数 、これは正規化された 3 次モーメントです。

As= 3 / 3、ここで、 3 は 3 次中心モーメントです。  3 – 標準偏差の 3 乗。 3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 。

左側非対称の場合 非対称係数 (として<0), при правосторонней (As>0) .

分布の上部が左にシフトし、枝の右側の部分が左側よりも長いことが判明した場合、そのような非対称性は次のようになります。 右側、 さもないと 左利き .

対称系列と非対称系列のモード、中央値、算術平均の関係により、非対称性の尺度としてより単純な指標を使用できるようになります。 非対称係数 ピアソン :

K a = ( –Mo)/。 K a >0 の場合、非対称性は右側になります。K a の場合、非対称性は右側になります。<0, то асимметрия левосторонняя, при К a =0 ряд считается симметричным.

非対称性は、3 次中心モーメントを使用してより正確に判断できます。

、ここで、3 = (m 3 – 3m 1 m 2 + 2m 1 3)k 3 です。

もし > 0 の場合、次の場合、非対称性は重大であると見なされます。 < 0,25 асимметрию можно считать не значительной.

縦軸に沿った正規分布からの対称分布の偏りの度合いを特徴づけるために、ピーキネス、つまり分布の急峻さを示す指標を、と呼ばれます。 過剰 :

Ex = ( 4 / 4) – 3、ここで:  4 – 4 次の中心モーメント。

正規分布の場合、Ex = 0、つまり  4 / 4 = 3.  4 = (m 4 – 4m 3 m 1 + 6m 2 m 2 1 – 3 m 4 1)* k 4 。

高ピークの曲線は正の尖度を持ち、低ピークの曲線は負の尖度を持ちます (図 D.2)。

尖度と歪度の指標は、母集団の不均一性、分布の非対称性、経験的分布の正規法則への近さを判断するための統計解析に必要です。 非対称性と尖度の指標がゼロから大きく逸脱しているため、母集団は均質であり、分布が正規に近いと見なすことはできません。 実際の曲線と理論上の曲線を比較することで、得られた統計結果を数学的に実証し、社会経済現象の分布の種類と性質を確立し、研究対象の事象の発生の可能性を予測することができます。

4.7. 経験的 (実際の) 分布が理論上の正規分布に近いことの正当性。 正規分布(ガウス・ラプラスの法則)とその特徴。 「スリーシグマの法則」。 適合度基準 (ピアソン基準またはコルゴモゴロフ基準の例を使用)。

さまざまな特性の周波数と値の変化に特定の関連性があることに気づくことができます。 属性の値が増加すると、頻度は最初に増加し、特定の最大値に達すると減少します。 このような変動系列における周波数の規則的な変化は、 分布パターン.

分布パターンを特定するには、変動系列に十分な数のユニットが含まれていること、および系列自体が質的に均一な集団を表すことが必要です。

実際のデータに基づいて構築された分布ポリゴンは、 経験的(実際の)分布曲線、客観的 (一般的) だけでなく、研究対象の現象の特徴ではない主観的 (ランダムな) 分布条件も反映します。

実際の作業では、経験的分布と理論的分布の 1 つを比較し、それらの間の差異または一致の程度を評価することによって、分布法則が見つかります。 理論上の分布曲線ランダム要因の影響を考慮せず、さまざまな特性の値に応じた頻度分布(分布密度)の一般的なパターンを純粋な形で反映します。

統計では、正規分布、二項分布、ポアソン分布など、さまざまなタイプの理論分布が一般的です。理論分布のそれぞれには、独自の特性と範囲があります。

正規分布の法則 多くのランダムな要因の相互作用中に発生する、同じ確率のイベントの分布の特徴。 正規分布の法則は、分布パラメータ、サンプル観察の代表性、および質量現象の関係を測定するための統計的手法の基礎となります。 実際の分布が正規分布にどの程度一致しているかを確認するには、実際の分布の周波数を正規分布則の理論上の周波数特性と比較する必要があります。 これらの周波数は正規化された偏差の関数です。 したがって、経験的分布系列のデータに基づいて、正規化された偏差 t が計算されます。 次に、対応する理論的周波数が決定されます。 これにより、経験的な分布が平坦化されます。

正規分布または、ガウス・ラプラスの法則は次の方程式で記述されます。
ここで、 y t は正規分布曲線の縦座標、または正規分布の値 x の頻度 (確率) です。 – 個々の x 値の数学的期待値 (平均値)。 値 (x – ) 標準偏差  で測定 (表現) します。つまり、 標準化 (正規化) 偏差で t = (x – )/ の場合、式は次の形式になります。
。 社会経済現象が純粋な形で正規分布することはまれですが、人口の均一性が維持されていれば、実際の分布は正規分布に近いことがよくあります。 研究対象の量の分布パターンは、経験的分布が理論的な正規分布法則に準拠しているかどうかを確認することで明らかになります。 これを行うには、実際の分布を正規曲線に合わせて計算します。 同意基準 .

正規分布は、個々の値のグループ化の中心と曲線の形状を決定する 2 つの重要なパラメーターによって特徴付けられます: 算術平均 標準偏差。 正規分布曲線は、X 軸上の分布中心の位置が異なります。 そしてこの中心の周りの散布オプション  (図 4.1 と 4.2)。 正規分布曲線の特徴は、分布の中心に対して対称であることです。その中央の両側に、横軸に漸近的に近づく 2 つの均一に減少する枝が形成されます。 したがって、正規分布では、平均、最頻値、中央値は同じになります。 =モ=私。

  バツ

正規分布曲線には、t = 1、つまり、 オプションが平均から逸脱した場合 (x – )、標準偏差  に等しい。 内で 正規分布の  は 68.3% です。 2 – 95.4%、以内 3 – 分布系列の観測値または頻度の 99.7%。 実際には、3を超える偏差はほとんどないため、この関係は「 スリーシグマの法則 ».

理論上の周波数を計算するには、次の式が使用されます。

.

マグニチュード
は t の関数、または正規分布の密度であり、特別な表から決定されます。表にはその抜粋が示されています。 4.2.

正規分布密度値 表4.2

図のグラフ。 4.3 は、経験的分布 (2) と正規分布 (1) が近いことを明確に示しています。

米。 4.3. 郵便局の支店数別分布

労働者: 1 – 通常。 2 – 経験的

経験的分布が正規分布の法則に近いことを数学的に証明するには、次のように計算します。 同意基準 .

コルモゴロフ基準 -経験的分布が正規分布にどれだけ近いかを評価できる適合度基準。 A. N. コルモゴロフは、これらの系列の累積周波数または周波数間の最大差を使用して、経験的正規分布と理論的正規分布の間の対応を決定することを提案しました。 経験的分布が正規分布の法則に対応するという仮説を検証するために、適合度基準 = D/ が計算されます。
, ここで、D は累積 (累積) 経験的頻度と理論的頻度の最大差、n は母集団内のユニット数です。特別なテーブルを使用して、P() が決定されます。これは、 を達成する確率です。変分特性は正規法則に従って分布します。その後、ランダムな理由により、経験的累積周波数と理論的累積周波数間の最大の差異は、実際に観察されたものと同じになります。 P() の値に基づいて、特定の結論が導き出されます。確率 P() が十分に大きければ、実際の分布が正規法則に対応するという仮説は確認されたと考えることができます。 確率 P() が小さい場合、帰無仮説は棄却され、実際の分布と理論上の分布の間の不一致が重大であるとみなされます。

適合度基準の確率値  表 4.3

ピアソン基準 2 (「カイ二乗」) - 経験的分布が正規分布にどれだけ近いかを評価できる適合度基準:
ここで、 f i 、 f" i は、特定の間隔における経験的分布と理論的分布の周波数です。観測された周波数と理論的周波数の差が大きければ大きいほど、基準  2 は大きくなります。偶然のサンプルによる差異から基準  2 に従って経験的分布と理論的分布を測定する場合、基準 2 calc の計算値は、適切な自由度および指定された有意水準を使用して表に作成された  2 表と比較されます。 P( 2 calc > 2 tab) =  となるようにレベルが選択されます。自由度の数は次のとおりです。 h、 どこ h– グループの数; – 理論上の周波数を計算する際に満たさなければならない条件の数。 次の式を使用して正規分布曲線の理論的頻度を計算するには、
3 つのパラメータを知っておく必要があります , , f であるため、自由度は h–3 になります。  2 calc > 2 tab の場合、つまり  2 が臨界領域に該当すると、経験的周波数と理論的周波数の差が大きくなり、サンプル データのランダムな変動では説明できなくなります。 この場合、帰無仮説は棄却されます。  2 計算  2 テーブルの場合、つまり 計算された基準が、偶然により発生する可能性のある周波数の最大発散を超えない場合、この場合、分布の対応に関する仮説が受け入れられます。 ピアソン基準は、有意な数の観測値 (n50) で有効であり、すべての間隔の度数は少なくとも 5 単位でなければならず (これより小さい値では、間隔が結合されます)、間隔 (グループ) の数は次のとおりです。推定値  2 は自由度の数に依存するため、大きくする必要があります (h>5)。

ロマノフスキー基準 -経験的分布が正規分布にどれだけ近いかを評価できる適合度基準。 ロマノフスキーは、以下に関連して経験的分布が正規分布曲線にどれだけ近いかを評価することを提案しました。

ここで、h はグループの数です。

比率が 3 より大きい場合、経験分布と正規分布の頻度間の不一致はランダムであるとは見なされず、正規分布の法則の仮説は拒否される必要があります。 比率が 3 以下の場合、データ分布は正規であるという仮説を受け入れることができます。

確率変数の分布の形状のおおよそのアイデアを得るために、その分布系列 (ポリゴンとヒストグラム)、関数または分布密度のグラフがプロットされます。 統計研究を実践すると、非常に異なる分布に遭遇します。 同種の集団は、原則として、単一頂点の分布によって特徴付けられます。 多頂点は、研究対象の母集団の不均一性を示します。 この場合、より均一なグループを識別するためにデータを再グループ化する必要があります。

確率変数の分布の一般的な性質を決定するには、その均質性の程度を評価することと、非対称性と尖度の指標を計算することが含まれます。 対称分布では、数学的期待値が中央値に等しくなります。 , 非対称性はないと考えてよい。 しかし、非対称性が顕著になればなるほど、分布中心の特性、つまり数学的期待値と中央値との間の偏差が大きくなります。

確率変数の分布の最も単純な非対称係数を考えることができます。ここで、 は数学的期待値、 は中央値、 は確率変数の標準偏差です。

右非対称、左非対称の場合。 の場合、非対称性は低、- 中、- の場合、非対称性は高いと見なされます。 右側と左側の非対称性の幾何学的な図を下の図に示します。 対応する種類の連続確率変数の分布密度のグラフを示します。

描画。 連続確率変数の分布の密度プロットにおける右側と左側の非対称の図。

確率変数の分布には別の非対称係数があります。 奇数次のゼロ以外の中心モーメントは、確率変数の分布の非対称性を示していることが証明できます。 前のインジケーターでは、一次モーメントに似た式を使用しました。 しかし、通常、この他の非対称係数では 3 次の中心モーメントが使用されます。 、この係数を無次元にするために、標準偏差の 3 乗で除算します。 結果の非対称係数は次のようになります。 。 この非対称係数については、最初の係数は右側非対称の場合、左側は - です。

確率変数の尖度

確率変数の分布の尖度は、分布の中心付近での値の集中度を特徴付けます。集中度が高いほど、その分布の密度グラフはより高く、より狭くなります。 尖度 (鋭さ) インジケーターは、次の式を使用して計算されます。 は 4 次の中心モーメントであり、標準偏差の 4 乗です。 分子と分母のべき乗が同じであるため、尖度は無次元量です。 この場合、尖度が無い、尖度がゼロであるという基準として正規分布をとることが認められています。 しかし、それは正規分布の場合に証明できます。 したがって、尖度を計算する式では、この端数から数値 3 が減算されます。

したがって、正規分布の場合、尖度は 0 になります。 尖度がゼロより大きい場合、つまり の場合、分布は通常よりもピークになります。 尖度がゼロ未満の場合、つまり の場合、分布は通常よりもピークが低くなります。 負の尖度の制限値は の値です。 正の尖度の大きさは無限に大きくなる可能性があります。 確率変数のピークとフラットトップの分布密度のグラフを正規分布と比較してどのように見えるかを図に示します。

描画。 正規分布と比較した、ランダム変数のピークとフラットトップの密度分布の図。

確率変数の分布の非対称性と尖度は、それが正規の法則からどの程度逸脱しているかを示します。 非対称性と尖度が大きい場合は、正規分布の計算式を使用しないでください。 特定の確率変数のデータ分析における正規分布式の使用において、非対称性と尖度がどの程度許容されるかは、研究者が知識と経験に基づいて決定する必要があります。

意味。 ファッション離散確率変数の M 0 は、その最確値と呼ばれます。 連続確率変数の場合、最頻値は分布密度が最大となる確率変数の値です。

離散確率変数の分布多角形または連続確率変数の分布曲線に 2 つ以上の極大値がある場合、そのような分布はと呼ばれます。 二峰性または マルチモーダル.

分布に最小値はあるが最大値がない場合、それは呼び出されます。 アンチモーダル.

意味。 中央値確率変数 X の M D は、確率変数のより大きい値またはより小さい値が得られる可能性が等しい確率に関連する値です。

幾何学的には、中央値は、分布曲線によって制限される領域が半分に分割される点の横座標です。

分布が単峰性の場合、最頻値と中央値は数学的期待と一致することに注意してください。

意味。 始まりの瞬間注文 k 確率変数 X は、値 X の数学的期待値です。 k .

離散確率変数の場合: 。

.

一次の初期モーメントは数学的期待値と等しくなります。

意味。 中心瞬間注文 k確率変数 X は値の数学的期待値です

離散確率変数の場合: .

連続確率変数の場合: .

一次中心モーメントは常にゼロであり、二次中心モーメントは分散に等しくなります。 3 次の中心モーメントは、分布の非対称性を特徴付けます。

意味。 3次の中心モーメントと標準偏差の3乗の比は次のように呼ばれます。 非対称係数.

意味。 分布のピーク性と平坦性を特徴付けるには、と呼ばれる量が必要です。 過剰。

考慮される量に加えて、いわゆる絶対モーメントも使用されます。

絶対的な開始瞬間: 。

絶対中心点: .

分位数 、確率の与えられたレベルに対応します R、分布関数が次の値をとる値です。 R、つまり どこ R- 確率の指定されたレベル。

言い換えると 分位数 ランダム変数の値があります。

確率 Rパーセンテージとして指定すると、対応する分位数に名前が付けられます。たとえば、40% 分位数と呼ばれます。

20. 独立した実験におけるイベントの発生数の数学的期待と分散。

意味。 数学的期待値可能な値がセグメントに属する連続確率変数 X は定積分と呼ばれます

確率変数の可能な値が数値軸全体で考慮される場合、数学的期待値は次の式で求められます。

この場合、もちろん、不適切な積分は収束すると仮定されます。

数学的期待値離散確率変数は、その可能な値とそれに対応する確率の積の合計です。

M(バツ) =バツ 1 R 1 +バツ 2 R 2 + … +バツ P R P . (7.1)

確率変数の取り得る値の数が無限である場合、
、結果の系列が絶対に収束する場合。

注1.数学的期待値は、次のように呼ばれることもあります。 加重平均これは、多数の実験にわたる確率変数の観測値の算術平均にほぼ等しいためです。

注2.数学的期待値の定義から、その値は確率変数の可能な最小値以上、最大値以下であることがわかります。

注3。離散確率変数の数学的期待値は次のとおりです。 非ランダム(絶え間ない。 連続確率変数にも同じことが当てはまることが後でわかります。

数学的期待の性質。

    定数の数学的期待値は定数自体と等しいです。

M() =と。(7.2)

証拠。 考えてみると 1 つの値のみを取る離散確率変数として 確率的に R= 1 の場合 M() =·1 = .

    定数因数は数学的期待記号から取り出すことができます。

M(CX) =CM(バツ). (7.3)

証拠。 確率変数の場合 バツ配信シリーズによって与えられる

バツ

バツ n

p

p n

次に、配信シリーズ CXの形式は次のとおりです。

バツ

バツ 1

バツ 2

バツ n

p

p n

それから M(CX) =CX 1 R 1 +CX 2 R 2 + … +CX P R P =(バツ 1 R 1 +バツ 2 R 2 + … +バツ P R P) =CM(バツ).

数学的期待値連続確率変数と呼ばれる

(7.13)

注1.分散の一般的な定義は、連続確率変数でも離散確率変数でも同じであり (定義 7.5)、分散の計算式は次の形式になります。

(7.14)

標準偏差は式(7.12)で計算されます。

注2.連続確率変数のすべての可能な値が区間外に収まらない場合 [ ある, b] の場合、式 (7.13) および (7.14) の積分はこれらの制限内で計算されます。

定理。 独立した試行におけるイベントの発生数の分散は、試行回数と 1 つの試行におけるイベントの発生または非発生の確率の積に等しくなります。

証拠。 を独立した試験におけるイベントの発生数としましょう。 これは、各試行におけるイベントの発生の合計に等しくなります: 。 テストは独立しているため、確率変数は – は独立しているため、 。

上に示すように、 、 、 。

それからああ .

この場合、前述したように、標準偏差は です。

母集団の分布を分析する場合、特定の分布の対称性からの逸脱、つまりその歪度の評価が非常に重要になります。 歪度 (非対称性) は、母集団分布の最も重要な特性の 1 つです。 非対称性を計算するために設計された統計が多数あります。 これらはすべて、歪度指標に関する少なくとも 2 つの要件を満たしています。それは、分布が対称である場合、指標が無次元であり、ゼロに等しくなることです。

図では、 図2a、bは、2つの非対称な母集団分布の曲線を示しており、一方は左に、もう一方は右に傾いている。 最頻値、中央値、平均値の相対位置が定性的に表示されます。 考えられる歪度指標の 1 つは、平均値と最頻値の相互の距離を考慮して構築できることがわかります。 しかし、経験的データからモードを決定する複雑さと、一方で、モード、中央値、平均の間のよく知られた関係 (3) を考慮して、非対称指数を計算するための次の公式が提案されました。

この式から、左に歪んだ分布は正の歪度を持ち、右に歪んだ分布は負の歪度を持つことがわかります。 当然のことながら、平均と中央値が一致する対称分布の場合、非対称性はゼロです。

表に示されているデータの非対称指標を計算してみましょう。 1 と 2. 心周期の持続時間の分布については、次のようになります。

したがって、この分布はわずかに左に偏っています。 非対称性について得られた値は近似値であり、単純化された方法で計算された値が計算に使用されているため、正確ではありません。

血清中のスルフヒドリル基の分布については、次のようになります。

したがって、この分布には負の歪度があります。 右に傾いています。

理論的には、式 13 で決定される値は 3 以内であることが示されています。しかし実際には、この値が限界値に達することはほとんどなく、中程度に非対称な単一頂点分布の場合、その絶対値は通常 1 未満になります。

非対称指標は、人口分布を正式に説明するためだけでなく、得られたデータを有意義に解釈するためにも使用できます。

実際、私たちが観察する特性が、互いに独立した多数の原因の影響下で形成されており、それぞれの原因がこの特性の値に比較的小さな寄与しかしていない場合、次のセクションで説明されているいくつかの理論的前提に従って、確率論のセクションで述べたように、実験の結果として得られる母集団分布が対称的であると期待する権利があります。 ただし、実験データで有意な非対称値が得られた場合 (As モジュロの数値が数十分の 1 以内)、上記で指定した条件が満たされていないと想定できます。

この場合、実験で観察された値の形成に対する寄与が他の要因よりも著しく大きい 1 つまたは 2 つの要因の存在を仮定するか、または次のような特別なメカニズムの存在を仮定するのが理にかなっています。これは、観察される特性の値に対する多くの原因の独立した影響のメカニズムとは異なります。

したがって、たとえば、特定の要因の作用に対応する、私たちにとって関心のある量の変化が、この値自体と原因の作用の強さに比例する場合、結果として得られる分布は常に、左、つまり 正の歪度を持っています。 たとえば生物学者は、植物や動物の成長に関連する量を推定するときに、このようなメカニズムに遭遇します。

歪度を評価する別の方法は、第 44 章で説明するモーメント法に基づいています。この方法に従って、平均に対するデータ系列のすべての値の偏差の合計を使用して歪度が計算されます。の 3 乗、つまり:

3 乗により、対称分布ではこの式の分子が 0 に等しくなります。この場合、平均からの 3 乗の上下の偏差の合計は等しく、反対の符号を持つためです。 で除算すると、非対称性の尺度が無次元になります。

式(14)は次のように変形できる。 前の段落で、標準化された値を紹介しました。

したがって、歪度の尺度は、標準化されたデータの 3 乗の平均です。

式 (13) を使用して非対称性が計算された同じデータについて、式 (15) を使用して指標を求めます。 我々は持っています:

当然のことながら、異なる計算式を使用して計算された非対称指標は大きさが互いに異なりますが、歪度の性質を同様に示します。 統計解析用のアプリケーションパッケージでは、非対称性を計算する際に、より正確な値が得られる式(15)を使用します。 簡易電卓による予備計算には式(13)を使用できます。

過剰。そこで、人口分布が記述されている指標の 4 つのグループのうち 3 つを調べました。 それらの最後は、ピーク性、または尖度(ギリシャ語 - ザトウクジラから)の指標のグループです。 尖度の考えられる指標の 1 つを計算するには、次の式が使用されます。

非対称式 (14) を変換するときに適用したのと同じアプローチを使用すると、次のことを簡単に示すことができます。

理論的には、確率論だけでなく統計学でも大きな役割を果たす正規 (ガウス) 分布曲線の尖度の値は、数値的には 3 に等しいことが示されました。多くの考慮事項に基づいて、尖度は 3 に等しくなります。この曲線は標準として採用されるため、尖度の指標として次の値を使用します。

表に示されているデータのピーク値を見つけてみましょう。 1. 私たちは以下のものを持っています:

したがって、心周期の持続時間の分布曲線は、正常な曲線と比較して平坦になります。

テーブル内 図 3 は、あるキク種の周縁花数の分布を示しています。 今回の配信に関しては

与えられた例からわかるように、尖度は非常に大きな値を取ることができますが、その下限は 1 未満にすることはできません。 分布が二峰性である場合、尖度値は下限に近づくため、-2 になる傾向があることがわかります。 したがって、計算の結果、値が -1 ~ 1.4 未満であることが判明した場合、自由に使用できる人口分布は少なくとも二峰性であると確信できます。 これは、実験データが前処理段階をバイパスしてデジタル コンピュータを使用して分析され、研究者の目の前に母集団分布を直接グラフ表示できない場合に考慮することが特に重要です。

実験データの 2 つのピークの分布曲線は、さまざまな理由で発生する可能性があります。 特に、このような分布は、異種データの 2 セットを 1 つのセットに結合することによって現れる可能性があります。 これを説明するために、2 種類の化石軟体動物の殻の幅に関するデータを人工的に 1 つのセットに組み合わせました (表 4、図 3)。

この図は、異なる母集団からの 2 セットのデータが混合されているため、2 つのモードの存在を明確に示しています。 計算により、尖度値は 1.74 となり、= -1.26 となります。 したがって、ピーク インデックスの計算値は、前述の位置に従って、分布に 2 つのピークがあることを示します。

ここで注意点が 1 つあります。 実際、母集団分布に 2 つの最大値があるすべての場合において、尖度値は 1 に近くなります。 ただし、この事実は、分析されたデータセットが 2 つの異種サンプルの混合物であるという結論を自動的に導くことはできません。 まず、そのような混合物は、その構成要素である凝集体の数に応じて、2 つのピークを持たない可能性があり、尖度指数は 1 より大幅に大きくなります。 第 2 に、たとえば実験データの選択要件に違反した場合、均質なサンプルは 2 つのモードを持つ可能性があります。 したがって、この場合も、他の場合と同様に、さまざまな統計を正式に計算した後、得られたデータに意味のある解釈を与えるために、徹底的な専門的な分析を実行する必要があります。

このセクションの最新資料:

主な環境マネジメントの種類
主な環境マネジメントの種類

2016/06/21 / ドンスコイ都市地区連邦法 2002 年 1 月 10 日第 7-FZ 号「環境保護について」により、初めてこの原則が確立されました。

ボールの定義。 数学。 フルコースは繰り返しご利用いただけます。 球の割線、弦、割面とその特性
ボールの定義。 数学。 フルコースは繰り返しご利用いただけます。 球の割線、弦、割面とその特性

ボールは、特定の点から特定の距離以下の距離にある空間内のすべての点で構成される物体です。 この点は...と呼ばれます。

Excel での経験的分布の歪度と尖度の計算 正規分布の尖度係数
Excel での経験的分布の歪度と尖度の計算 正規分布の尖度係数

非対称係数は、中心に対する分布系列の「歪み」を示します。 ここで、 は 3 次の中心モーメントです。 - 立方体...