分散分析。 コースワーク: 分散分析 多変量分散分析

分散分析は、特定の特性と定量的記述のない調査対象因子との関係についての仮説を検証し、因子の影響の程度とそれらの相互作用を確立するために設計された一連の統計手法です。 専門文献では、ANOVA (英語名 Analysis of variations から) と呼ばれることがよくあります。 この方法は、1925 年に R. Fischer によって初めて開発されました。

分散分析の種類と基準

この方法は、定性的 (名目) 特性と量的 (連続的) 変数の間の関係を研究するために使用されます。 本質的には、複数のサンプルの算術平均が等しいかどうかに関する仮説をテストします。 したがって、これは、複数のサンプルの中心を一度に比較するためのパラメトリック基準として考えることができます。 この方法を 2 つのサンプルに使用した場合、分散分析の結果はスチューデントの t 検定の結果と同じになります。 ただし、他の基準とは異なり、この調査では問題をより詳細に調査することができます。

統計における分散分析は、「結合サンプルの偏差の二乗和は、グループ内偏差の二乗和とグループ間偏差の二乗和に等しい」という法則に基づいています。 この研究では、フィッシャーの検定を使用して、グループ間分散とグループ内分散間の差異の有意性を確立しています。 ただし、これに必要な前提条件は、分布の正規性とサンプルの等分散性 (分散の等価性) です。 分散分析には、単変量 (1 因子) と多変量 (多因子) があります。 1 つ目では、調査対象の値の 1 つの特性への依存性が考慮され、2 つ目では、一度に多くの特性への依存性が考慮され、それらの間の関係を特定することもできます。

要因

要因とは、最終結果に影響を与える制御された状況です。 そのレベルまたは処理方法は、この状態の特定の症状を特徴付ける値です。 これらの数値は通常、名目または序数の測定スケールで表されます。 多くの場合、出力値は定量的または順序的なスケールで測定されます。 次に、ほぼ同じ数値に対応する多数の観測値の出力データをグループ化するという問題が発生します。 グループの数が過度に多くなると、信頼できる結果を得るにはグループ内の観測値の数が不十分になる可能性があります。 数値が小さすぎると、システムへの影響に関する重要な機能が失われる可能性があります。 データをグループ化する具体的な方法は、値の変動の量と性質によって異なります。 単変量解析における区間の数とサイズは、ほとんどの場合、等間隔の原則または等頻度の原則によって決定されます。

分散問題の分析

したがって、2 つ以上のサンプルを比較する必要がある場合があります。 このような場合には、分散分析を使用することをお勧めします。 この方法の名前は、分散成分の研究に基づいて結論が導かれることを示しています。 研究の本質は、指標の全体的な変化が、個々の要因の作用に対応する構成部分に分割されることです。 典型的な分散分析によって解決されるいくつかの問題を考えてみましょう。

例1

工場には特定の部品を生産する自動機械が多数あります。 各部品のサイズは、各機械の設定と部品の製造プロセス中に発生するランダムな偏差に依存する確率変数です。 部品の寸法の測定データに基づいて、機械が同じ構成になっているかどうかを判断する必要があります。

例 2

電気機器の製造では、コンデンサ、電気機器など、さまざまなタイプの絶縁紙が使用されます。機器には、エポキシ樹脂、ワニス、ML-2 樹脂などのさまざまな物質を含浸させることができます。リークは真空下で除去できます。加圧、加熱あり。 含浸は、ワニスへの浸漬、ワニスの連続流下などによって行うことができます。電気機器全体には特定の化合物が充填されており、その化合物にはいくつかのオプションがあります。 品質指標は、絶縁体の電気強度、動作モードでの巻線の過熱温度、その他多数です。 デバイス製造の技術プロセスの開発中に、リストされた各要因がデバイスの性能にどのような影響を与えるかを判断する必要があります。

例 3

トロリーバス乗り場は、いくつかのトロリーバス路線を運行しています。 さまざまなタイプのトロリーバスを運行しており、125 人の検査官が運賃を徴収しています。 車庫管理者は、さまざまなルートやさまざまなタイプのトロリーバスを考慮して、各管制官の仕事 (収益) の経済指標をどのように比較するかという問題に興味を持っています。 特定のルートで特定のタイプのトロリーバスを生産することの経済的実現可能性をどのように判断するのでしょうか? さまざまなタイプのトロリーバスの各路線で車掌がもたらす収益額について、合理的な要件を確立するにはどうすればよいでしょうか?

方法を選択するタスクは、最終結果に対する各要因の影響に関する最大限の情報を取得し、そのような影響の数値的特性とその信頼性を最小限のコストと可能な限り短い時間で判断する方法です。 分散分析の方法を使用すると、このような問題を解決できます。

単変量解析

研究の目的は、分析されたレビューに対する特定のケースの影響の大きさを評価することです。 単変量解析のもう 1 つの目的は、2 つ以上の状況を相互に比較して、想起に対する影響の違いを判断することです。 帰無仮説が棄却された場合、次のステップは、取得した特性の信頼区間を定量化して構築することです。 帰無仮説を棄却できない場合、通常は帰無仮説が受け入れられ、影響の性質について結論が導き出されます。

一元配置分散分析は、クラスカル-ウォリス順位法のノンパラメトリック類似物になる可能性があります。 この基準は、1952 年にアメリカの数学者ウィリアム クラスカルと経済学者ウィルソン ウォリスによって開発されました。この基準は、未知だが等しい平均値を使用して、研究サンプルに対する影響が等しいという帰無仮説を検定するように設計されています。 この場合、サンプル数は 2 つ以上である必要があります。

Jonckheere-Terpstra 基準は、1952 年にオランダの数学者 T. J. Terpstra と 1954 年に英国の心理学者 E. R. Jonckheere によって独自に提案されました。既存の結果グループが、影響力の増大によって順序付けされることが事前にわかっている場合に使用されます。研究中の因子。順序尺度で測定されます。

M - 1937 年に英国の統計学者モーリス スティーブンソン バートレットによって提案されたバートレット検定は、研究対象のサンプルが採取される、通常は異なるサイズ (それぞれの数サンプルは少なくとも 4 つ必要です)。

G - コクラン検定。1941 年にアメリカ人のウィリアム ジェメル コクランによって発見されました。これは、同じサイズの独立したサンプルにおける正規母集団の分散の等価性に関する帰無仮説を検定するために使用されます。

1960 年にアメリカの数学者 Howard Levene によって提案されたノンパラメトリック Levene 検定は、研究対象のサンプルが正規分布に従うかどうか確信が持てない状況における Bartlett 検定の代替手段です。

1974 年、アメリカの統計学者モートン B. ブラウンとアラン B. フォーサイスは、レビーンの検定とは少し異なる検定 (ブラウン-フォーサイス検定) を提案しました。

二要素分析

二元配置分散分析は、関連する正規分布サンプルに対して使用されます。 実際には、この方法の複雑なテーブル、特に各セルに固定レベル値に対応する一連のデータ (反復測定) が含まれるテーブルがよく使用されます。 二元配置分散分析を適用するために必要な仮定が満たされない場合は、1930 年末にアメリカの経済学者ミルトン・フリードマンによって開発されたノンパラメトリック フリードマン ランク テスト (フリードマン、ケンダル、スミス) を使用します。このテストはタイプに依存しません。配布の。

値の分布は同一かつ連続的であり、それら自体は互いに独立しているとのみ想定されます。 帰無仮説を検定する場合、出力データは長方形行列の形式で表示されます。行は因子 B のレベルに対応し、列は因子 A のレベルに対応します。テーブル (ブロック) の各セルは次のようになります。両方の要素のレベルの一定値を持つ 1 つのオブジェクトまたはオブジェクトのグループのパラメータの測定結果。 この場合、対応するデータは、研究対象のサンプルのすべての寸法またはオブジェクトに対する特定のパラメーターの平均値として表示されます。 出力基準を適用するには、測定の直接の結果からそのランクに移行する必要があります。 ランキングは行ごとに個別に実行されます。つまり、値は固定値ごとに並べられます。

ページの検定 (L 検定) は、1963 年にアメリカの統計学者 E. B. ペイジによって提案され、帰無仮説を検定するように設計されています。 大きなサンプルの場合は、Page の近似が使用されます。 これらは、対応する帰無仮説の現実に従って、標準正規分布に従います。 ソーステーブルの行が同じ値を持つ場合、平均ランクを使用する必要があります。 この場合、そのような一致の数が増えるほど、結論の精度は悪くなります。

Q - 1937 年に W. コクランによって提案されたコクランの基準。これは、同種の被験者のグループが影響にさらされ、その数が 2 を超え、フィードバックの 2 つのオプションが可能である場合に使用されます。条件付きで負 (0) と条件付きで正 (1) 。 帰無仮説は治療効果の同等性から構成されます。 二元配置分散分析では、治療効果の存在を判断できますが、この効果がどの特定の列に存在するかを判断することはできません。 この問題を解決するために、関連するサンプルに対する複数のシェッフェ方程式の方法が使用されます。

多変量解析

多変量分散分析の問題は、特定の確率変数に対する 2 つ以上の条件の影響を判断する必要がある場合に発生します。 この研究には、差または比率スケールで測定される 1 つの従属確率変数と、それぞれが名前付けまたはランク スケールで表現されるいくつかの独立変数の存在が含まれます。 データの分散分析は数理統計のかなり発展したセクションであり、多くのオプションがあります。 研究コンセプトは単一因子と多因子の両方に共通です。 その本質は、合計分散がデータの特定のグループに対応する成分に分割されるという事実にあります。 各データ グループには独自のモデルがあります。 ここでは、最もよく使用されるオプションを理解して実際に使用するために必要な基本的な規定のみを検討します。

因子の分散分析では、入力データの収集と表示、特に結果の解釈に対してかなり慎重な態度が必要です。 条件付きで結果を特定の順序に配置できる 1 要素テストとは異なり、2 要素テストの結果はより複雑な表現を必要とします。 状況が 3 つ、4 つ以上になると、状況はさらに複雑になります。 このため、モデルに 3 つ (4 つ) を超える条件が含まれることは非常にまれです。 例としては、電気円の静電容量とインダクタンスがある値で共振が発生することが挙げられます。 システムを構築する特定の要素セットとの化学反応の発現。 特定の状況の偶然の一致の下で、複雑なシステムで異常な効果が発生すること。 相互作用の存在はシステムのモデルを根本的に変える可能性があり、場合によっては実験者が扱っている現象の性質の再考につながる可能性があります。

反復実験による多変量分散分析

測定データは、2 つの要因ではなく、より多くの要因によってグループ化されることがよくあります。 そこで、トロリーバスのタイヤ寿命のばらつきを状況(製造工場やタイヤが運行される路線)を考慮して分析すると、別の条件としてタイヤが使用される季節を抽出することができます。タイヤが作動します(つまり、冬季および夏季の作動)。 その結果、三要素法の問題が発生します。

さらに条件がある場合、アプローチは 2 要素分析と同じです。 いずれの場合も、モデルを単純化しようとします。 2 つの因子の相互作用の現象はそれほど頻繁には現れず、三重の相互作用は例外的な場合にのみ発生します。 以前の情報があり、それを考慮する十分な理由があるインタラクションをモデルに含めます。 個々の要因を特定して考慮するプロセスは比較的簡単です。 したがって、より多くの状況を強調したいという要望がしばしばあります。 これに夢中になってはいけません。 条件が増えるほど、モデルの信頼性が低下し、エラーの可能性が高くなります。 モデル自体には多数の独立変数が含まれるため、解釈が非常に複雑になり、実用には不便です。

分散分析の一般的な考え方

統計における分散分析は、同時に動作するさまざまな状況に依存する観察結果を取得し、その影響を評価する方法です。 研究対象に影響を与える方法に相当し、一定期間にわたって一定の値を取得する制御量を因子といいます。 それらは定性的でも定量的でもあります。 定量的条件のレベルは、数値スケールで一定の意味を獲得します。 例としては、温度、プレス圧力、物質の量などがあります。 定性的要因は、さまざまな物質、さまざまな技術的方法、デバイス、フィラーです。 それらのレベルは名前のスケールに対応します。

品質には、包装材料の種類や剤形の保管条件も含まれる場合があります。 また、定量的な意味はあるものの、定量的なスケールを使用した場合には調整が困難な、原材料の粉砕の程度や顆粒の分別組成を含めることも合理的です。 定性的要因の数は、剤形の種類、医薬品の物理的および技術的特性によって異なります。 例えば、錠剤は、結晶性物質から直接圧縮することによって得ることができる。 この場合、滑り物質と潤滑物質を選択するだけで十分です。

さまざまな種類の剤形の品質要因の例

  • チンキ剤。抽出剤の組成、抽出装置の種類、原料調製方法、製造方法、濾過方法。
  • 抽出物(液体、濃厚、乾燥)。抽出剤の組成、抽出方法、設備の種類、抽出剤およびバラスト物質の除去方法。
  • 丸薬。賦形剤、充填剤、崩壊剤、結合剤、滑沢剤および潤滑剤の組成。 錠剤の入手方法、技術機器の種類。 シェルの種類とその成分、皮膜形成剤、顔料、染料、可塑剤、溶剤。
  • 注射液。溶剤の種類、濾過方法、安定剤や保存料の性質、滅菌条件、アンプルの充填方法。
  • 座薬。坐剤基剤の組成、坐剤の製造方法、充填剤、包装。
  • 軟膏。基剤の組成、構造成分、軟膏の製造方法、器具の種類、包装。
  • カプセル。殻の材質の種類、カプセルの製造方法、可塑剤の種類、防腐剤、染料。
  • リニメント剤。製造方法、組成、設備の種類、乳化剤の種類。
  • サスペンション。溶剤の種類、安定剤の種類、分散方法。

錠剤の製造プロセス中に研究される品質要素とそのレベルの例

  • ベーキングパウダー。ジャガイモデンプン、白土、重炭酸ナトリウムとクエン酸の混合物、塩基性炭酸マグネシウム。
  • 結合溶液。水、でんぷんペースト、砂糖シロップ、メチルセルロース溶液、ヒドロキシプロピルメチルセルロース溶液、ポリビニルピロリドン溶液、ポリビニルアルコール溶液。
  • 滑り物質。アエロジル、デンプン、タルク。
  • フィラー。砂糖、ブドウ糖、乳糖、塩化ナトリウム、リン酸カルシウム。
  • 潤滑剤。ステアリン酸、ポリエチレングリコール、パラフィン。

国家の競争力レベルの研究における分散分析モデル

国家の状態を評価するための最も重要な基準の 1 つは、国家の幸福度や社会経済的発展のレベルを評価するためのものですが、競争力、つまり国家の競争力を決定する国民経済に固有の一連の特性です。他国と競争する能力。 世界市場における国家の位置と役割を決定すれば、国際規模で経済安全保障を確保するための明確な戦略を確立することが可能となる。なぜならそれがロシアと世界市場のすべての関係者、つまり投資家との良好な関係の鍵だからである。 、債権者、政府。

国家の競争力のレベルを比較するために、さまざまな加重指標を含む複雑な指標を使用して各国がランク付けされます。 これらの指数は、経済、政治などの状況に影響を与える主要な要因に基づいています。 国家の競争力を研究するための一連のモデルには、多変量統計分析手法 (特に、分散分析 (統計)、計量経済モデリング、意思決定) の使用が含まれており、次の主要な段階が含まれます。

  1. 指標システムの形成。
  2. 州の競争力指標の評価と予測。
  3. 州の競争力の指標の比較。

次に、この複合体の各段階のモデルの内容を見てみましょう。

最初の段階では専門的な研究方法を使用して、国家の競争力を評価するための十分に根拠のある一連の経済指標が形成され、国際格付けと統計部門からのデータに基づく国家発展の詳細が考慮され、システム全体の状態が反映されます。とそのプロセス。 これらの指標の選択は、実際的な観点から、国家のレベル、投資の魅力、既存の潜在的脅威と実際の脅威の相対的な局所化の可能性を判断できるものを最も完全に選択する必要性によって正当化されます。

国際格付けシステムの主な指標は次のとおりです。

  1. 世界競争力 (GC)。
  2. 経済的自由 (IES)。
  3. 人間開発 (HDI)。
  4. 汚職の認識 (CPC)。
  5. 内部および外部の脅威 (IETH)。
  6. 国際的な影響力の可能性 (IPIP)。

第二段階研究対象の世界 139 か国の国際格付けに基づいた国家競争力指標の評価と予測を提供します。

第三段階相関分析と回帰分析の方法を使用して、国家の競争条件を比較します。

研究の結果を使用すると、一般的なプロセスの性質と、国家の競争力の個々の要素の性質を判断することができます。 要因の影響とそれらの関係についての仮説を、適切な有意水準でテストします。

提案された一連のモデルの導入により、各州の競争力と投資の魅力のレベルの現状を評価できるだけでなく、経営上の欠陥を分析し、誤った決定の誤りを防ぎ、国家危機の進展を防ぐことも可能になるだろう。州。

分散分析

1. 分散分析の概念

分散分析制御された変数要因の影響下での形質の変動性の分析です。 外国の文献では、分散分析は ANOVA と呼ばれることが多く、分散分析(分散分析)と訳されます。

分散分析問題形質の一般的な変動性から異なる種類の変動性を分離することにあります。

a) 研究対象の各独立変数の作用による変動。

b) 研究対象の独立変数の相互作用による変動。

c) 他のすべての未知の変数によるランダムな変動。

研究中の変数の作用およびそれらの相互作用による変動は、ランダム変動と相関しています。 この関係を示す指標はフィッシャーの F 検定です。

F 基準を計算する式には分散の推定値、つまり属性の分布パラメータが含まれるため、F 基準はパラメトリック基準となります。

研究中の変数(因子)またはそれらの相互作用による形質の変動性が大きければ大きいほど、 経験的基準値.

ゼロ 分散分析の仮説は、調査された有効特性の平均値がすべての階調で同じであると述べます。

代替 この仮説では、研究対象の因子のさまざまな段階で得られる特性の平均値が異なると述べられます。

分散分析により特性の変化を述べることができますが、それを示すものではありません。 方向これらの変化。

の作用のみを研究する最も単純なケースから分散分析の検討を始めましょう。 1つ変数 (1 つの要素)。

2. 無関係なサンプルの一元配置分散分析

2.1. この方法の目的

一因子分散分析の手法は、条件の変化や因子の階調の影響による実効特性の変化を調べる場合に使用されます。 このバージョンの方法では、因子の各段階の影響は次のようになります。 違う被験者のサンプル。 因子には少なくとも 3 つの段階が必要です。 (2 つの段階があるかもしれませんが、この場合、非線形の依存関係を確立することができないため、より単純なものを使用する方が合理的と思われます)。

このタイプの分析のノンパラメトリック バージョンは、クラスカル-ウォリス H 検定です。

仮説

H 0: 因子グレード間の差異 (異なる条件) は、各グループ内のランダムな差異よりも大きくありません。

H 1: 因子グレード間の差異 (異なる条件) は、各グループ内のランダムな差異よりも大きくなります。

2.2. 無関係なサンプルに対する一元配置分散分析の限界

1. 一元配置分散分析には、因子の少なくとも 3 つの階調と、各階調に少なくとも 2 つの被験者が必要です。

2. 結果として得られる特性は、研究対象のサンプル内に正規分布する必要があります。

確かに、調査対象のサンプル全体における特性の分布について話しているのか、それとも分散複合体を構成する部分における特性の分布について話しているのかは、通常は示されていません。

3. 無関係なサンプルに対する一元配置分散分析の方法を使用して問題を解決する例を次に示します。

6 人の被験者からなる 3 つの異なるグループに、10 個の単語のリストが与えられました。 単語は、最初のグループには低速 - 5 秒あたり 1 単語、第 2 グループには平均速度 - 2 秒あたり 1 単語、そして 3 番目のグループには高速 - 1 秒あたり 1 単語で提示されました。 再現パフォーマンスは単語の提示速度に依存すると予測されました。 結果を表に示す。 1.

再生された単語の数 表1

件名番号

低速

平均速度

高速

合計金額

H 0: 単語生成スパンの違い グループはランダムな差異と同じように顕著ではありません 内部各グループ。

H1: 言葉の生産量の違い グループはランダムな差異よりも顕著です 内部各グループ。 表に示す実験値を使用します。 1、F 基準を計算するために必要ないくつかの値を確立します。

一元配置分散分析の主な量の計算を表に示します。

表2

表3

無関係なサンプルに対する一元配置分散分析の一連の操作

この表および後続の表でよく見られる SS という記号は、「平方和」の略語です。 この略語は、翻訳されたソースで最もよく使用されます。

SS 事実研究対象の因子の作用による特性の変動性を意味します。

SS 一般的に- 形質の一般的な変動性。

S C.A.- 説明されていない要因による変動、「ランダム」または「残留」変動。

MS- 「平均二乗」、または二乗和の数学的期待値、対応する SS の平均値。

DF - 自由度の数。ノンパラメトリック基準を考慮する場合、ギリシャ文字で表します。 v.

結論: H 0 は拒否されます。 H1は受け入れられます。 グループ間の単語想起の差は、各グループ内のランダムな差よりも大きかった (α=0.05)。 したがって、言葉の提示の速度は、その再生産の量に影響を与えます。

Excel での問題を解決する例を以下に示します。

初期データ:

コマンド: [ツール] -> [データ分析] -> [一元配置分散分析] を使用すると、次の結果が得られます。

2 つの平均間の差異の重要性に関する統計的仮説を検証するための上記の手法は、実際には応用が限られています。 これは、有効な形質に対する考えられるすべての条件と要因の影響を特定するために、原則として、野外および実験室での実験が 2 つではなく、より多くのサンプル (1220 以上) を使用して実行されるという事実によるものです。 )。

多くの場合、研究者は、単一の複合体に結合された複数のサンプルの平均を比較します。 たとえば、さまざまな種類や用量の肥料が作物の収量に及ぼす影響を研究する場合、さまざまなバージョンで実験が繰り返されます。 このような場合、ペアごとの比較は面倒になり、複合体全体の統計分析には特別な方法を使用する必要があります。 この方法は数理統計で開発され、分散分析と呼ばれます。 これは、英国の統計学者 R. フィッシャーが農業実験の結果を処理する際に初めて使用しました (1938 年)。

分散分析有効な特性の 1 つ以上の要因への依存性の発現の信頼性を統計的に評価する方法です。 分散分析の方法を使用して、正規分布を持ついくつかの一般的な母集団の平均に関して統計的仮説が検証されます。

分散分析は、実験結果を統計的に評価するための主要な方法の 1 つです。 経済情報の分析でも使用されることが増えています。 分散分析により、結果特性と因子特性の間の関係のサンプル指標が、サンプルから得られたデータを一般母集団に拡張するのにどの程度十分であるかを確立することができます。 この方法の利点は、小さなサンプルからかなり信頼性の高い結論が得られることです。

分散分析を使用して 1 つまたは複数の要因の影響下で有効な特性の変動を研究することにより、依存関係の重要性の一般的な推定に加えて、形成される平均値の大きさの差異の評価も得ることができます。さまざまなレベルの要因、および要因の相互作用の重要性。 分散分析は、量的特性と質的特性の両方の依存関係、およびそれらの組み合わせを研究するために使用されます。

この方法の本質は、1 つまたは複数の要因の影響の確率と、結果として生じる特性に対するそれらの相互作用の統計的研究です。 これによると、分散分析を使用して 3 つの主要なタスクが解決されます。1) グループ平均間の差異の重要性の一般的な評価。 2) 要因間の相互作用の可能性を評価する。 3) 平均値のペア間の差異の重要性の評価。 ほとんどの場合、研究者は、有効な形質に対するいくつかの要因の影響を研究する野外実験や畜産実験を行う際に、このような問題を解決する必要があります。

分散分析の原理スキームには、有効特性の変動の主な原因を確立し、その形成源に応じて変動量 (偏差の二乗和) を決定することが含まれます。 全変動の成分に対応する自由度の数を決定する。 対応する変動量と自由度の比として分散を計算します。 分散間の関係の分析。 平均値間の差異の信頼性を評価し、結論を導き出します。

このスキームは、データが 1 つの特性によってグループ化される場合の分散分析の単純なモデルと、データが 2 つ以上の特性によってグループ化される場合の複雑なモデルの両方で維持されます。 ただし、グループ特性の数が増加すると、全体の変動をその形成源に応じて分解するプロセスがより複雑になります。

原理図によれば、分散分析は 5 つの連続した段階の形式で表すことができます。

1) バリエーションの定義と拡張。

2)変動の自由度の数の決定。

3) 分散とその比率の計算。

4) 分散とその関係の分析。

5) 平均間の差の重要性を評価し、帰無仮説をテストするための結論を定式化します。

分散分析で最も労力がかかる部分は、第 1 段階です。つまり、変動の形成原因に応じて変動を特定し、分解することです。 変動の総体積の分解順序については、第 5 章で詳しく説明しました。

分散分析の問題を解決するための基礎は、変動の拡大 (追加) の法則です。これに従って、結果として得られる属性の変動 (変動) の合計が 2 つに分割されます。調査対象の要因の作用によって引き起こされる変動です。 、およびランダムな原因の作用によって引き起こされる変動、つまり

研究対象の母集団が因子特性に従っていくつかのグループに分割され、各グループが結果として得られる特性の独自の平均値によって特徴付けられると仮定します。 同時に、これらの値の変動は、有効符号に体系的に作用し、実験中に調整できるものと、調整できないものの 2 種類の理由によって説明できます。 グループ間 (要因または系統的) 変動は主に研究対象の要因の作用に依存し、グループ内 (残差またはランダム) 変動は主にランダム要因の作用に依存することは明らかです。

グループ平均間の差異の信頼性を評価するには、グループ間およびグループ内の変動を決定する必要があります。 グループ間(要因)変動がグループ内(残差)変動を大幅に超える場合、その要因が結果の特性に影響を与え、グループ平均の値が大きく変化します。 しかし、グループ平均間の差異の信頼性 (有意性) を結論付けるのに十分であると考えられるグループ間変動とグループ内変動の間にはどのような関係があるのか​​、という疑問が生じます。

平均間の差異の重要性を評価し、分散分析で帰無仮説 (H0:x1 = x2 =... = xn) をテストするための結論を定式化するには、一種の標準、G 基準、分布法則が使用されます。 R.フィッシャーによって設立されました。 この基準は、2 つの分散の比率です。調査対象の因子の作用によって生成される階乗分散と、ランダムな原因の作用によって生じる残差です。

分散関係 Γ = £>u : アメリカの統計学者スネデコールは、分散分析の発明者である R. フィッシャーに敬意を表して、£*2 を文字 G で表すことを提案しました。

分散 °2 io2 は母集団分散の推定値です。 分散°2 °2 を持つサンプルが同じ一般母集団から作成され、値の変動がランダムである場合、値 °2 °2 の不一致もランダムです。

実験で有効な形質に対する複数の要因 (A、B、C など) の影響を同時にテストする場合、それぞれの作用による分散は次の値に匹敵するはずです。 °e.gP、 あれは

因子の分散の値が残差よりも大幅に大きい場合、因子は結果の属性に大きな影響を与え、その逆も同様です。

多因子実験では、各因子の作用による変動に加えて、ほとんどの場合、因子間の相互作用による変動が存在します ($ав: ^лс ^вс $ліс)。 相互作用の本質は、1 つの要因の効果が、2 番目の要因のレベルが異なると大きく変化することです (たとえば、肥料の投与量が異なる場合の土壌品質の効果など)。

因子の相互作用も、対応する分散 3 ^v.gr を比較することによって評価する必要があります。

B 基準の実際の値を計算する場合、大きい方の分散が分子に取り込まれるため、B > 1 となります。明らかに、B 基準が大きいほど、分散間の差が大きくなります。 B = 1 の場合、分散の差の有意性を評価する問題は削除されます。

分散比のランダムな変動の限界を決定するために、G. Fischer は特別な B 分布表を開発しました (付録 4 および 5)。 この基準は関数的に確率に関連し、変動の自由度の数に依存します。 k1および 2 つの比較された分散の k2。 通常、有意水準 0.05 および 0.01 の基準の非常に高い値について結論を得るには、2 つの表が使用されます。 有意水準 0.05 (または 5%) は、基準 B が 100 件中 5 件のみが表に示されている値以上の値を取ることができることを意味します。 有意水準を 0.05 から 0.01 に下げると、ランダムな理由のみの影響により、2 つの分散の間の基準の値が増加します。

基準の値は、比較される 2 つの分散の自由度の数にも直接依存します。 自由度の数が無限大 (k-me) になる傾向がある場合、2 つの分散の比 B は 1 になる傾向があります。

基準 B の表にされた値は、特定の有意水準における 2 つの分散の比の考えられるランダムな値と、比較される各分散の対応する自由度の数を示します。 示された表は、同じ一般集団から作成されたサンプルの B の値を示していますが、値の変化の理由はランダムにすぎません。

Γ の値は、表 (付録 4 および 5) の対応する列 (分散が大きい場合の自由度 - k1) と行 (分散が小さい場合の自由度 - k2) の交点で求められます。 )。 したがって、大きい方の分散 (分子 Г) が k1 = 4、小さい方の分散 (分母 Г) が k2 = 9 である場合、有意水準 а = 0.05 での Г は 3.63 になります (付録 4)。 したがって、ランダムな原因の結果、サンプルが小さいため、1 つのサンプルの分散は 5% の有意水準で 2 番目のサンプルの分散を 3.63 倍超える可能性があります。 有意水準が 0.05 から 0.01 に減少すると、上で述べたように、基準 G の表の値が増加します。 したがって、同じ自由度 k1 = 4、k2 = 9、および a = 0.01 の場合、基準 G の表にされた値は 6.99 になります (付録 5)。

分散分析の自由度を決定する手順を考えてみましょう。 偏差二乗和の総和に相当する自由度は、偏差二乗和の分解 (^total = No^gr + ]\vhr) と同様に、対応する成分に分解されます。自由度の総数 (k") は、グループ間 (k1) およびグループ内 (k2) の変動の自由度に分解されます。

したがって、サンプル母集団が次のものから構成されている場合、 N観測値を次の値で割った値 T グループ (実験オプションの数) と P サブグループ (繰り返し数) の場合、自由度 k は次のようになります。

a) 二乗偏差の総和 (s7zag)

b) グループ間偏差二乗和の場合 ^m.gP)

c) グループ内偏差二乗和の場合 V v.gR)

バリエーションを追加するためのルールによると、次のようになります。

たとえば、実験で、それぞれ 5 回の繰り返し (n = 5) で実験の 4 つのバリエーションが形成され (t = 4)、観測値の合計数が N = = であるとします。 T o p = 4 * 5 = 20 の場合、自由度の数は次のようになります。

偏差の二乗和と自由度の数がわかれば、3 つの分散の不偏 (修正) 推定値を決定できます。

帰無仮説 H0 は、Student の t 検定と同じ方法で基準 B を使用して検定されます。 H0 のチェックに関する決定を行うには、基準の実際の値を計算し、それを許容された有意水準 a および自由度の表の値 Ba と比較する必要があります。 k1 2 つの分散の場合は k2 です。

Bfaq > Ba の場合、受け入れられた有意水準に従って、標本分散の差はランダム要因だけによって決定されるわけではないと結論付けることができます。 それらは重要です。 この場合、帰無仮説は棄却され、その要因が結果として得られる特性に大きな影響を与えると主張する理由があります。 もし< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

特定の分散分析モデルの使用は、調査対象の要因の数とサンプリング方法の両方に依存します。

c 結果の特性の変動を決定する要因の数に応じて、1 つ、2 つ、またはそれ以上の要因に従ってサンプルを形成できます。 これによると、分散分析は単一因子と多因子に分けられます。 それ以外の場合は、単一要素分散複合体および多要素分散複合体とも呼ばれます。

全体の変動の分解スキームは、グループの形成に依存します。 これは、ランダム (1 つのグループの観測値が 2 番目のグループの観測値に関連しない) と非ランダム (2 つのサンプルの観測値が共通の実験条件によって相互に関連する) の場合があります。 それに応じて、独立サンプルと依存サンプルが取得されます。 独立したサンプルは、等しい数と奇数の両方で形成できます。 依存サンプルの形成では、それらのサイズが等しいと想定されます。

グループがランダムな順序で形成される場合、結果として得られる形質の変動の総量には、階乗 (グループ間) および残差変動に加えて、反復の変動が含まれます。

実際には、ほとんどの場合、グループとサブグループの条件が等しい場合、従属サンプルを考慮する必要があります。 そこで、フィールド実験では、サイト全体を最も多様な条件のブロックに分割します。 この場合、実験の各バリアントはすべてのブロックで表現される平等な機会を受け取り、それによってテストされたすべての実験バリアントの条件が均等になります。 この実験を構築する方法は、ランダム化ブロック法と呼ばれます。 動物実験も同様に行われます。

分散分析手法を使用して社会経済データを処理する場合は、多数の要因とそれらの相互関係により、条件を最も注意深く平準化したとしても、客観性の程度を確立することが困難であることに留意する必要があります。結果として得られる特性に対する個々の要因の影響。 したがって、残差変動のレベルは、ランダムな原因だけでなく、分散分析モデルの構築時に考慮されなかった重要な要因によっても決定されます。 この結果、比較の基礎としての残差分散は、その目的に対して不適切になる場合があり、値が明らかに過大評価されており、要因の影響の重要性の基準として機能できません。 この点で、分散分析モデルを構築する際には、最も重要な要因を選択し、それぞれの作用が発現する条件を平準化するという問題が関係します。 その上。 分散分析の使用では、調査対象の統計母集団が正規分布または正規に近い分布であると仮定します。 この条件が満たされない場合、分散分析で得られる推定値は誇張されてしまいます。

人は、それを応用しようとすることによってのみ、自分の能力を認識することができます。 (セネカ)

分散分析

はじめに

このセクションでは、ANOVA の基本的な方法、仮定、用語を確認します。

英語の文献では、分散分析は通常、Analytics ofvariance と呼ばれることに注意してください。 したがって、簡潔にするために、以下では時々この用語を使用します。 分散分析 (アン分析 ああ f ヴァ理性) 通常の ANOVA と項 マノバ多変量分散分析用。 このセクションでは、分散分析の主な考え方を順番に確認していきます( 分散分析)、共分散分析 ( アンコバ)、多変量分散分析 ( マノバ) および共分散の多変量分析 ( マンコバ)。 コントラスト分析と事後テストの利点について簡単に説明した後、ANOVA 手法の基礎となる仮定を見てみましょう。 このセクションの終わりに向けて、反復測定分析における従来の単変量アプローチに対する多変量アプローチの利点について説明します。

重要なアイデア

分散分析の目的。分散分析の主な目的は、平均間の差異の重要性を調べることです。 章 (第 8 章) では、統計的有意性の研究について簡単に説明します。 2 つのサンプルの平均を単純に比較する場合、分散分析では通常の分析と同じ結果が得られます。 t- 独立したサンプルをテストする (オブジェクトまたは観測の 2 つの独立したグループを比較する場合)、または t- 依存サンプルの基準 (2 つの変数がオブジェクトまたは観測の同じセットで比較される場合)。 これらの基準に慣れていない場合は、導入章の概要を参照することをお勧めします。 (第9章)。

名前の由来は何ですか 分散分析? 平均を比較する手順が分散分析と呼ばれるのは奇妙に思えるかもしれません。 実際には、平均間の差の統計的有意性を調べるとき、実際には分散を分析していることになるからです。

平方和の分割

サンプルサイズが n の場合、サンプル分散は、サンプル平均からの二乗偏差の合計を n-1 (サンプルサイズから 1 を引く) で割ったものとして計算されます。 したがって、固定サンプル サイズ n の場合、分散は二乗和 (偏差) の関数であり、簡潔にするために次のように表されます。 SS(英語の二乗和 - 二乗和より)。 分散分析の基礎は、分散を部分に分離(または分割)することです。 次のデータセットを考えてみましょう。

2 つのグループの平均値は大きく異なります (それぞれ 2 と 6)。 偏差の二乗和 内部各グループは 2 に等しい。それらを合計すると 4 が得られる。これらの計算を繰り返すと、 除くグループのメンバーシップ、つまり計算すると SS 2 つのサンプルの全体の平均に基づいて、28 が得られます。言い換えると、グループ内の変動に基づく分散 (二乗和) は、全体の変動に基づいて計算された場合よりもはるかに小さな値になります (グループ内の変動と比較して)。全体の平均値)。 この理由は明らかに平均間の有意な差であり、この平均間の差は二乗和間の既存の差を説明します。 実際、モジュールを使用して特定のデータを分析すると、 分散分析、次の結果が得られます。

表から分かるように、平方和の総和は SS=28 を次の二乗和で割ります。 グループ内変動性 ( 2+2=4 ; 表の 2 行目を参照)、平均値の差による二乗和を計算します。 (28-(2+2)=24; 表の最初の行を参照)。

SS エラーとSS 効果。グループ内変動 ( SS)通常分散と呼ばれます エラー。これは、実験を実行するときに、通常は予測も説明もできないことを意味します。 反対側では、 SS 効果(またはグループ間の変動)は、研究グループの平均値間の差異によって説明できます。 つまり、あるグループに属しているということです 説明するグループ間変動、なぜなら 私たちは、これらのグループが異なる手段を持っていることを知っています。

重要性チェック。統計的有意性検定の基本的な考え方については、次の章で説明します。 統計の基本概念(第8章)。 この章では、多くの検定で説明された分散と説明されていない分散の比率が使用される理由についても説明します。 この使用例としては、分散分析自体が挙げられます。 ANOVA における有意性の検定は、グループ間の分散 (と呼ばれる) による分散の比較に基づいています。 平均二乗効果または MS効果) およびグループ内変動による分散(と呼ばれる) 平均二乗誤差または MSエラー)。 帰無仮説 (2 つの母集団の平均値が等しい) が真である場合、ランダムな変動によるサンプル平均値の差は比較的小さいことが予想されます。 したがって、帰無仮説の下では、グループ内の分散は、グループのメンバーシップを考慮せずに計算された合計分散と実質的に一致します。 結果として得られるグループ内分散は、次を使用して比較できます。 F- 分散比が 1 より大幅に大きいかどうかをチェックするテスト。上で説明した例では F- この基準は、平均間の差が統計的に有意であることを示します。

分散分析の基本ロジック。要約すると、ANOVA の目的は、(グループまたは変数の) 平均間の差の統計的有意性を検定することです。 このチェックは分散分析を使用して実行されます。 合計分散 (変動) をいくつかの部分に分割することによって、そのうちの 1 つはランダム誤差 (つまり、グループ内変動) によるものであり、2 つ目は平均値の差に関連しています。 次に、最後の分散成分を使用して、平均間の差の統計的有意性が分析されます。 この差が有意な場合、帰無仮説は棄却され、平均間に差があるという対立仮説が受け入れられます。

従属変数と独立変数。実験中の測定値(テストスコアなど)によって値が決定される変数を「変数」と呼びます。 依存変数。 実験で制御できる変数 (たとえば、観察をグループに分割するための教育方法やその他の基準) は、と呼ばれます。 要因または 独立した変数。 これらの概念については、次の章で詳しく説明します。 統計の基本概念(第8章)。

多変量分散分析

上記の簡単な例では、適切なモジュール オプションを使用して、独立したサンプルの t 検定をすぐに計算できます。 基本的な統計と表。得られた結果は当然分散分析の結果と一致します。 ただし、ANOVA には、より複雑な研究​​に使用できる柔軟で強力な手法が含まれています。

多くの要因。世界は本質的に複雑かつ多次元です。 特定の現象が 1 つの変数で完全に記述される状況は、非常にまれです。 たとえば、大きなトマトの栽培方法を学ぼうとしている場合、植物の遺伝的構造、土壌の種類、光、温度などに関連する要因を考慮する必要があります。 したがって、典型的な実験を行う場合には、多数の要因に対処する必要があります。 ANOVA を使用することが、異なる因子レベルで 2 つのサンプルを繰り返し比較するよりも好ましい主な理由です。 t- 基準は、分散分析がより優れていることです。 効果的サンプルが小さい場合は、より多くの情報が得られます。

因子管理。上で説明した 2 サンプル分析の例で、別の要素を追加するとします。 - 性別。 各グループを男性 3 名、女性 3 名で構成します。 この実験の計画は、2 行 2 列の表の形式で表すことができます。

実験。 グループ1 実験。 グループ2
男性2 6
3 7
1 5
平均2 6
女性4 8
5 9
3 7
平均4 8

計算を行う前に、この例では合計分散には少なくとも 3 つのソースがあることがわかります。

(1) ランダム誤差 (グループ分散内)、

(2) 実験グループのメンバーシップに関連する変動性、および

(3) 観察対象の性別によるばらつき。

(変動の原因として考えられるものは他にもあることに注意してください - 要因の相互作用これについては後で説明します)。 含めないとどうなるか 性別分析の要素として使用し、通常の t-基準? 二乗和を無視して計算すると、 床 -性別(つまり、グループ内分散を計算するときに、性別の異なるオブジェクトを 1 つのグループに結合し、それによって各グループの二乗和が次の値に等しくなります) SS=10、および平方和の合計 SS= 10+10 = 20)、次のようにサブグループにさらに分割してより正確な分析を行う場合よりも、より大きな値のグループ内分散が得られます。 性別(この場合、グループ内平均は 2 に等しく、グループ内平方和の合計は に等しくなります。 SS = 2+2+2+2 = 8)。 この違いは、平均値が次のとおりであるという事実によるものです。 男性 - 男性~の平均よりも少ない 女性 -女性、そして性別が考慮されていない場合、この平均値の違いにより、グループ内の全体的なばらつきが増加します。 誤差の分散を制御すると、テストの感度 (検出力) が向上します。

この例は、従来の分散分析と比較した分散分析の別の利点を示しています。 t- 2 つのサンプルの基準。 分散分析を使用すると、残りの因子の値を制御することで各因子を研究できます。 実際、これが統計的検出力が向上する主な理由です (意味のある結果を得るには、より小さいサンプル サイズが必要です)。 このため、分散分析は、たとえ小さなサンプルであっても、単純な分散分析よりも統計的に有意な結果が得られます。 t- 基準。

インタラクション効果

従来の分散分析と比較して、分散分析を使用することにはもう 1 つの利点があります。 t- 基準: 分散分析により、次のことを検出できます。 交流したがって、より複雑なモデルの研究が可能になります。 説明のために、別の例を考えてみましょう。

主効果、ペアワイズ(二因子)交互作用。学生の 2 つのグループがあり、最初のグループの学生は心理的に、割り当てられた課題を完了することに決意があり、怠惰な学生で構成される 2 番目のグループの学生よりも目的意識が高いとします。 各グループをランダムに半分に分け、各グループの半分に難しいタスクを与え、残りの半分に簡単なタスクを与えましょう。 次に、生徒がこれらのタスクにどれだけ熱心に取り組んでいるかを測定します。 この (架空の) 研究の平均を表に示します。

これらの結果からどのような結論が導き出せるでしょうか? 次のように結論付けることができますか: (1) 生徒は複雑な課題により熱心に取り組みます。 (2) やる気のある学生は怠惰な学生よりも熱心に働きますか? これらの記述はいずれも、表に示されている平均値の体系的な性質の本質を捉えていません。 結果を分析すると、やる気のある生徒だけが難しい課題に熱心に取り組み、怠惰な生徒だけが簡単な課題に熱心に取り組む、と言ったほうが正しいでしょう。 つまり、生徒の性格と課題の難易度 相互作用する費やされる労力に相互に影響を与えます。 それは一例です ペアの相互作用生徒の性格と課題の難易度の関係。 ステートメント 1 と 2 で説明していることに注意してください。 主な効果.

高次の相互作用。ペア相互作用はまだ比較的簡単に説明できますが、高次の相互作用は説明がはるかに困難です。 上で検討した例に、別の要素が導入されたと想像してみましょう。 -性別そして、次の平均値の表が得られました。

得られた結果からどのような結論が導き出せるでしょうか? 平均プロットを使用すると、複雑な効果を簡単に解釈できます。 ANOVA モジュールを使用すると、マウスをほぼ 1 回クリックするだけでこれらのグラフを作成できます。

以下のグラフの画像は、研究されている 3 因子交互作用を表しています。

グラフを見ると、女性の場合は性格とテストの難易度の間に相互作用があることがわかります。やる気のある女性は、簡単な課題よりも難しい課題に一生懸命取り組みます。 男性の場合、同じやり取りが逆になります。 因子間の相互作用の説明がさらに混乱していることがわかります。

インタラクションを説明する一般的な方法。一般に、要因間の相互作用は、ある効果が別の効果の影響下で変化することとして説明されます。 上で説明した例では、2 因子交互作用は、生徒の性格を記述する因子の影響下で、課題の難しさを特徴づける因子の主効果が変化するものとして説明できます。 前の段落の 3 つの要素の相互作用については、2 つの要素 (課題の複雑さと生徒の性格) の相互作用が影響を受けて変化すると言えます。 性別性別. 4 つの因子の相互作用を研究すると、3 つの因子の相互作用は 4 番目の因子の影響を受けて変化すると言えます。 第 4 因子のさまざまなレベルには、さまざまな種類の相互作用があります。 多くの分野では、5 つ以上の要因が相互作用することは珍しいことではありません。

複雑な計画

グループ間デザインとグループ内デザイン(反復測定デザイン)

2 つの異なるグループを比較する場合、通常はこれが使用されます。 t- 独立したサンプルの基準 (モジュールから) 基本的な統計と表)。 2 つの変数が同じオブジェクトのセット (観測値) で比較される場合に使用されます。 t- 依存サンプルの基準。 分散分析では、サンプルが依存しているかどうかも重要です。 同じ変数の繰り返し測定がある場合 (異なる条件下または異なる時間で) 同じオブジェクトに対して、その後、彼らは存在について話します 反復測定係数(とも呼ばれている グループ内要因、重要性を評価するためにグループ内の二乗和が計算されるため)。 オブジェクトの異なるグループが比較される場合 (たとえば、男性と女性、3 種類の細菌など)、グループ間の違いが説明されます。 グループ間要因。説明されている 2 つのタイプの因子の有意性基準を計算する方法は異なりますが、一般的なロジックと解釈は同じです。

グループ間およびグループ内の計画。多くの場合、実験では、被験者間要因と反復測定要因の両方を計画に含める必要があります。 たとえば、女子学生と男子学生の数学の能力が測定されます(ここで、 床 -性別-グループ間係数) 学期の初めと終わりに。 各学生のスキルの 2 つの尺度は、グループ内因子 (反復測定因子) を形成します。 被験者間および反復測定因子の主効果と交互作用の解釈は一貫しており、両方のタイプの因子が明らかに相互作用する可能性があります(たとえば、女性は一学期の間にスキルを獲得しますが、男性はスキルを失います)。

不完全な (ネストされた) 計画

多くの場合、相互作用効果は無視できます。 これは、集団内に交互作用効果がないことがわかっている場合、または完全な相互作用効果が実装されている場合に発生します。 階乗計画は不可能です。 たとえば、4 つの燃料添加剤が燃料消費量に及ぼす影響が研究されています。 4台のマシンと4人のドライバーが選ばれます。 満杯 階乗実験では、添加剤、ドライバー、車の各組み合わせが少なくとも 1 回出現する必要があります。 これには少なくとも 4 x 4 x 4 = 64 グループのテストが必要ですが、時間がかかりすぎます。 さらに、ドライバーと燃料添加剤との間に相互作用が生じる可能性はほとんどありません。 この点を考慮してプランをご利用いただけます ラテン広場、これには 16 のテスト グループのみが含まれています (4 つの添加剤は文字 A、B、C、および D で示されます)。

ラテン方陣については、実験計画法に関するほとんどの書籍 (例: Hays、1988、Lindman、1974、Miliken and Johnson、1984、Winer、1962) で説明されており、ここでは詳しく説明しません。 ラテン方陣は次のとおりであることに注意してください。 ないn満杯因子水準のすべての組み合わせが含まれるわけではない計画。 たとえば、ドライバー 1 は添加剤 A のみを使用して車 1 を運転し、ドライバー 3 は添加剤 C のみを使用して車 1 を運転します。 因子レベル 添加物( A、B、C、D) は表のセルにネストされています 自動車バツ 運転者 -巣の中の卵のようなもの。 このニーモニックは自然を理解するのに役立ちます ネストされた、またはネストされた予定。 モジュール 分散分析では、このようなタイプの計画を分析する簡単な方法を提供します。

共分散分析

本旨

章内 重要なアイデア因子制御の考え方と、加算因子を含めることで二乗誤差の合計がどのように減少し、計画の統計的検出力が向上するかについて簡単に説明しました。 これらすべては、連続した値のセットを持つ変数に拡張できます。 このような連続変数が計画に因子として含まれる場合、それらは次のように呼ばれます。 共変量.

固定共変量

2 つの異なる教科書を使用して教えられた 2 つのグループの生徒の数学スキルを比較するとします。 また、各生徒の知能指数 (IQ) データが入手できると仮定しましょう。 IQ は数学のスキルに関連していると想定して、その情報を使用できます。 2 つの生徒グループのそれぞれについて、IQ と数学スキルの間の相関係数を計算できます。 この相関係数を使用すると、IQ の影響によって説明されるグループ内の分散の割合と、説明のつかない分散の割合を分離することができます (以下も参照) 統計の基本概念(第8章)および 基本的な統計と表(第9章))。 分散の残りの部分は、誤差分散として分析に使用されます。 IQ と数学スキルの間に相関関係がある場合、誤差の分散は大幅に減少する可能性があります。 SS/(n-1) .

共変量の影響F- 基準。 F-この基準は、グループ内の平均値の差の統計的有意性を評価し、グループ間分散の比率が計算されます( MS効果) から誤差分散 ( MSエラー) 。 もし MSエラーたとえば、IQ 係数を考慮すると、値は減少します。 Fが増加します。

共変量がたくさんあります。単一の共変量 (IQ) に対して上記で使用した推論は、複数の共変量に簡単に拡張できます。 たとえば、IQ に加えて、モチベーション、空間的思考などの測定値を含めることができます。 通常の相関係数の代わりに重相関係数を使用します。

値がF -基準が下がります。実験計画に共変量を導入すると、重要性が低下する場合があります。 F-基準 . これは通常、共変量が従属変数 (数学スキルなど) だけでなく要因 (異なる教科書など) とも相関していることを示しています。 2 つの異なる教科書を使用して 2 つのグループの生徒をほぼ 1 年間教えた後、学期の終わりに IQ を測定するとします。 学生はランダムにグループに割り当てられましたが、教科書の差が非常に大きいため、IQ と数学スキルの両方がグループ間で大きく異なる可能性があります。 この場合、共変量は誤差の分散だけでなく、グループ間の分散も削減します。 言い換えれば、グループ間の IQ の差を制御した後は、数学スキルの差はもはや重要ではなくなります。 別の言い方もできます。 IQ の影響を「除外」した後、数学的スキルの発達に対する教科書の影響が意図せずに除外されてしまいます。

調整された平均。共変量が被験者間の要因に影響を与える場合、次の計算を行う必要があります。 調整された手段、つまり これらの平均は、すべての共変量推定値を除去した後に得られます。

共変量と因子間の相互作用。因子間の相互作用を調べるのと同様に、共変量間の相互作用や因子のグループ間の相互作用も調べることができます。 教科書の 1 つが特に頭の良い生徒に適しているとします。 2 番目の教科書は頭の良い生徒にとっては退屈であり、同じ教科書は頭の悪い生徒にとっては難しいものです。 その結果、最初のグループでは IQ と学習成果の間に正の相関関係があり (より賢い生徒、より良い成績が得られる)、2 番目のグループではゼロまたはわずかに負の相関が見られます (生徒が賢いほど、数学的スキルを習得する可能性は低くなります)。 2冊目の教科書より)。 一部の研究では、この状況が共分散分析の仮定の違反の例として議論されています。 ただし、ANOVA モジュールは最も一般的な共分散分析方法を使用するため、特に因子と共変量間の相互作用の統計的有意性を評価することが可能です。

変数共変量

固定共変量は教科書で頻繁に議論されますが、可変共変量についてはそれほど頻繁には言及されません。 通常、繰り返し測定を行う実験を行う場合、異なる時点での同じ量の測定値の違いに関心があります。 つまり、これらの違いの重要性に興味があります。 共変量が従属変数の測定と同時に測定される場合、共変量と従属変数の間の相関関係を計算できます。

たとえば、数学への興味と数学のスキルを学期の初めと終わりに探究することができます。 数学への興味の変化が数学のスキルの変化と相関しているかどうかをテストすることは興味深いでしょう。

モジュール 分散分析 V 統計可能な場合、設計における共変量の変化の統計的有意性を自動的に評価します。

多変量計画: 分散および共分散の多変量分析

グループ間計画

前に説明したすべての例には、従属変数が 1 つだけ含まれていました。 同時に複数の従属変数がある場合、計算の複雑さだけが増加しますが、内容や基本原則は変わりません。

たとえば、2 つの異なる教科書について研究が行われたとします。 同時に、生徒の物理学と数学の学習の成功も研究されます。 この場合、従属変数が 2 つあり、2 つの異なる教科書がそれらに同時にどのような影響を与えるかを調べる必要があります。 これを行うには、多変量分散分析 (MANOVA) を使用できます。 一次元ではなく F基準、多次元が使用される F誤差共分散行列とグループ間共分散行列の比較に基づく検定 (ウィルクス l 検定)。

従属変数が互いに相関している場合は、有意性基準を計算するときにこの相関を考慮する必要があります。 当然のことながら、同じ測定を 2 回繰り返しても、新しいことは何も得られません。 相関ディメンションを既存のディメンションに追加すると、何らかの新しい情報が取得されますが、新しい変数には冗長な情報が含まれており、これが変数間の共分散に反映されます。

結果の解釈。全体的な多変量テストが有意であれば、対応する効果 (教科書タイプなど) が有意であると結論付けることができます。 しかし、次のような疑問が生じます。 教科書の種類は数学スキルのみ、身体スキルのみ、または両方のスキルの向上に影響しますか? 実際、有意な多変量検定を取得した後、個々の主効果または交互作用について単変量検定が検査されます。 F基準。 言い換えれば、多変量検定の重要性に寄与する従属変数は個別に検査されます。

反復測定の設計

学生の数学と物理のスキルが学期の初めと終わりに測定される場合、これらは繰り返し測定されます。 このような計画における重要性基準の研究は、1 次元のケースを論理的に発展させたものです。 多変量分散分析手法は、2 水準を超える単変量反復測定因子の重要性を調べるためにも一般的に使用されることに注意してください。 対応するアプリケーションについては、このパートの後半で説明します。

変数値の合計と多変量分散分析

単変量分散分析と多変量分散分析の経験豊富なユーザーであっても、多変量分散分析をたとえば 3 つの変数に適用する場合と、一変量分散分析をこれら 3 つの変数の合計に適用する場合とでは、異なる結果を得ることが難しいと感じることがあります。は単一の変数でした。

アイデア 合計変数とは、各変数には研究対象の実際の変数と、ランダムな測定誤差が含まれているということです。 したがって、変数の値を平均すると、すべての測定値の測定誤差が 0 に近くなり、平均値の信頼性が高くなります。 実際、この場合、変数の合計に ANOVA を適用するのは合理的であり、強力な手法です。 ただし、従属変数が本質的に多次元である場合、変数の値を合計することは不適切です。

たとえば、従属変数が 4 つの指標で構成されているとします。 社会での成功。 各指標は、人間の活動の完全に独立した側面 (たとえば、職業上の成功、ビジネスの成功、家族の幸福など) を特徴付けます。 これらの変数を追加することは、リンゴとオレンジを追加することに似ています。 これらの変数の合計は、適切な一次元の尺度ではありません。 したがって、そのようなデータは多次元指標として扱う必要があります。 多変量分散分析.

コントラスト分析と事後テスト

別々の平均セットが比較されるのはなぜですか?

通常、実験データに関する仮説は、単に主効果や交互作用の観点から定式化されるわけではありません。 たとえば、次のような仮説が考えられます。ある教科書は男子生徒の数学スキルのみを向上させますが、別の教科書は男女ともにほぼ同等の効果がありますが、男性にはまだ効果が低いです。 教科書の有効性は生徒の性別と相互作用することが予測できます。 ただし、この予測も当てはまります 自然相互作用。 1 冊の本を使用する生徒については男女間の大きな差があり、もう 1 冊の本を使用する生徒については性別ごとに実質的に独立した結果が得られることが予想されます。 このタイプの仮説は、通常、コントラスト分析を使用して検証されます。

コントラストの分析

つまり、コントラスト分析により、複雑な効果の特定の線形結合の統計的有意性を評価できます。 コントラスト分析は、複雑な ANOVA 計画の主要かつ必須の要素です。 モジュール 分散分析には、あらゆる種類の平均値の比較を分離して分析できる、非常に多様な対比分析機能があります。

事後的に比較

実験を処理した結果、予期せぬ効果が発見されることがあります。 ほとんどの場合、創造的な研究者はどのような結果でも説明することができますが、これではさらなる分析や予測の推定はできません。 この問題は、次のような問題の 1 つです。 事後的な基準、つまり、使用しない基準です。 アプリオリ仮説。 これを説明するために、次の実験を考えてみましょう。 1から10までの数字が書かれたカードが100枚あるとします。これらのカードをすべて帽子の中に入れて、ランダムに5枚のカードを20回選び、各サンプルの平均値(カードに書かれた数字の平均)を計算します。 平均値が大きく異なる 2 つのサンプルが存在すると予想できますか? これは非常にもっともらしいです! 最大平均と最小平均を持つ 2 つのサンプルを選択すると、たとえば最初の 2 つのサンプルの平均の差とは大きく異なる平均の差を取得できます。 この違いは、たとえばコントラスト分析を使用して調べることができます。 詳細には立ち入りませんが、いわゆる 事後的に最初のシナリオ (20 個のサンプルから極端な平均値を取得する) に正確に基づいた基準、つまり、これらの基準は、計画内のすべての平均値を比較するために最も異なる平均値を選択することに基づいています。 これらの基準は、人為的な効果が純粋に偶然によって得られたものではないことを保証するために使用されます。たとえば、平均値間に有意差がない場合にそれを検出するために使用されます。 モジュール 分散分析では、そのような基準を幅広く提供しています。 複数のグループが参加する実験で予期せぬ結果が得られた場合、 事後的に得られた結果の統計的有意性を調べる手順。

二乗和タイプ I、II、III、IV

多変量回帰と分散分析

多変量回帰法と分散分析(分散分析)の間には密接な関係があります。 どちらの方法でも、線形モデルが検討されます。 つまり、ほぼすべての実験計画は多変量回帰を使用して検証できます。 次の単純なグループ間 2 x 2 設計を考えてみましょう。

DV B 斧B
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

列 A と B には因子 A と B のレベルを特徴付けるコードが含まれ、列 AxB には 2 つの列 A と B の積が含まれます。このデータは多変量回帰を使用して分析できます。 変数 DV従属変数として定義された変数 前に 斧B独立変数として。 回帰係数の有意性の検討は、因子の主効果の有意性の分散分析の計算と同時に行われます。 そして Bと相互作用効果 斧B.

アンバランスなプランとバランスの取れたプラン

上に示したデータなど、すべての変数の相関行列を計算すると、要因の主効果が次のように計算されることがわかります。 そして Bと相互作用効果 斧B無相関。 効果のこの特性は直交性とも呼ばれます。 彼らは効果を言います そして B - 直交または 独立した互いに。 上の例のように、プラン内のすべての効果が互いに直交している場合、そのプランは次のようになります。 バランスのとれた.

バランスの取れた計画には「優れた性質」があります。 このような計画を分析するための計算は非常に簡単です。 すべての計算は、結局のところ、効果と従属変数の間の相関関係を計算することになります。 効果は直交しているため、部分相関(完全な相関関係のように) 多次元回帰)は計算されません。 しかし、現実の生活では、計画は常にバランスがとれているわけではありません。

セル内の観測値の数が等しくない実際のデータを考えてみましょう。

ファクターA ファクターB
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

このデータを上記のようにコード化し、すべての変数の相関行列を計算すると、設計要素が互いに相関していることがわかります。 計画内の要素はもはや直交ではなくなり、そのような計画は次のように呼ばれます。 アンバランスな。検討中の例では、因子間の相関は完全にデータ行列の列の 1 と -1 の頻度の違いによるものであることに注意してください。 言い換えれば、不等な細胞体積(より正確には、不均衡な体積)を含む実験計画はバランスが崩れ、主効果と相互作用が混乱することを意味します。 この場合、効果の統計的有意性を計算するには、完全な多変量回帰を計算する必要があります。 ここにはいくつかの戦略があります。

二乗和タイプ I、II、III、IV

二乗和タイプそして. 多変量モデルの各因子の重要性を調べるには、他のすべての因子がモデル内ですでに考慮されている場合、各因子の偏相関を計算できます。 段階的にモデルに因子を入力し、すでにモデルに入力されているすべての因子を取得し、他のすべての因子を無視することもできます。 一般に、次のような違いがあります。 タイプ そして タイプ平方和 (この用語は SAS で導入されました。たとえば、SAS、1982 年を参照。詳しい議論は Searle、1987、p. 461、Woodward、Bonett、および Brecht、1990、p. 216、または Milliken にも記載されています)およびジョンソン、1984、138 ページ)。

二乗和タイプII.次の「中間」モデル形成戦略は、次の内容で構成されます。 1 つの主効果の重要性を調べるときに、すべての主効果を制御します。 個々のペアごとの交互作用の重要性を調べるときに、すべての主効果とすべてのペアごとの交互作用を制御する際。 すべてのペアごとの相互作用および 3 つの因子のすべての相互作用のすべての主効果を制御する場合。 3つの要素の個別の相互作用を研究する場合など。 このようにして計算された効果の二乗和は次のように呼ばれます。 タイプ平方和。 それで、 タイプ二乗和は、同じ次数以下のすべての効果を制御しますが、高次の効果はすべて無視します。

二乗和タイプ. 最後に、セルが欠落している一部の特別な計画 (不完全な計画) については、いわゆる タイプ 平方和。 この方法については、不完全なデザイン (セルが欠落しているデザイン) に関連して後で説明します。

タイプ I、II、III の二乗和仮説の解釈

平方和 タイプ解釈しやすい。 二乗和を思い出してください タイプ他のすべての効果を制御した後で効果を検証します。 たとえば、統計的に有意な結果が見つかった後、 タイプ因子に対する効果 モジュール内で 分散分析、因子の重要な効果が 1 つあると言えます。 、他のすべての効果(要因)を導入した後、この効果をそれに応じて解釈します。 おそらくすべての ANOVA アプリケーションの 99% において、これは研究者が興味を持っているタイプの検定です。 このタイプの二乗和は通常、モジュロで計算されます。 分散分析オプションが選択されているかどうかに関係なく、デフォルトで 回帰アプローチかどうか (モジュールで採用されている標準的なアプローチ) 分散分析以下で説明します)。

二乗和を使用して得られる顕著な効果 タイプまたは タイプ二乗和の解釈はそれほど簡単ではありません。 これらは、段階的多変量回帰のコンテキストで最もよく解釈されます。 二乗和を使用する場合 タイプ因子 B の主効果が有意であった (因子 A がモデルに含まれた後、A と B の間の相互作用が追加される前)。相互作用がない限り、因子 B の有意な主効果があると結論付けることができます。要因 A と B の間。(基準を使用する場合) タイプ、因子 B も有意であることが判明した場合、他のすべての因子とそれらの相互作用をモデルに導入した後、因子 B に有意な主効果があると結論付けることができます)。

限界平均仮説の観点から タイプそして タイプ通常、単純な解釈はありません。 このような場合、限界平均値だけを見て効果の重要性を解釈することはできないと言われています。 むしろ提示された p平均値は、平均値とサンプルサイズを組み合わせた複雑な仮説に関連しています。 例えば、 タイプ前に説明した 2 x 2 計画の単純な例における因子 A の仮説は次のようになります (Woodward、Bonett、および Brecht、1990、p. 219 を参照)。

ニジ- セル内の観測値の数

ウイジ- セル内の平均値

n. j- 限界平均

あまり詳しく説明しなくても (詳細については、Miliken and Johnson、1984 年、第 10 章を参照)、これらが単純な仮説ではないことは明らかであり、ほとんどの場合、研究者にとって特に興味深いものはありません。 ただし、仮説が立てられるケースもあります。 タイプ面白いかも知れません。

モジュール内のデフォルトの計算アプローチ 分散分析

オプションがチェックされていない場合のデフォルト 回帰アプローチ、モジュール 分散分析用途 セル平均モデル。 このモデルの特徴は、さまざまな効果の二乗和がセル平均の線形結合に対して計算されることです。 完全要因実験では、これにより、前に説明した平方和と同じ平方和が得られます。 タイプ 。 ただし、オプションでは、 計画された比較(窓の中で 分散分析結果) を使用すると、ユーザーは重み付けされたセル平均値または重み付けされていないセル平均値の線形結合に対して仮説をテストできます。 したがって、ユーザーは仮説を検証するだけでなく、 タイプただし、あらゆるタイプの仮説( タイプ)。 この一般的なアプローチは、セルが欠落しているデザイン (不完全なデザインと呼ばれます) を検査する場合に特に役立ちます。

完全実施要因計画の場合、このアプローチは加重周辺平均を分析したい場合にも役立ちます。 たとえば、前に検討した単純な 2 x 2 計画で、(因子水準による) 重み付けを比較する必要があるとします。 B) 因子 A の周辺平均。これは、細胞全体の観察値の分布が実験者によって準備されたのではなく、ランダムに構築された場合に役立ちます。このランダム性は、細胞内の因子 B のレベル全体にわたる観察値の数の分布に反映されます。集計。

たとえば、未亡人の年齢という要因があります。 回答者の考えられるサンプルは、40 歳未満と 40 歳以上の 2 つのグループに分けられます (因子 B)。 計画の 2 番目の要素 (要素 A) は、未亡人が何らかの機関から社会的支援を受けているかどうかでした (一部の未亡人は無作為に選ばれ、他の未亡人は対照として機能しました)。 この場合、サンプル内の年齢別の未亡人の分布は、母集団内の年齢別の未亡人の実際の分布を反映しています。 寡婦のための社会的支援グループの有効性を評価する 全年齢は、2 つの年齢グループの加重平均に対応します (重みはグループ内の観察数に対応します)。

計画された比較

入力されたコントラスト係数の合計が 0 (ゼロ) に等しくなるわけではないことに注意してください。 代わりに、プログラムは、対応する仮説が全体の平均と混同されないように自動的に調整を行います。

これを説明するために、前に説明した単純な 2 x 2 プランに戻りましょう。 この不均衡計画のセル内の観測値の数が -1、2、3、および 1 であることを思い出してください。因子 A の加重周辺平均 (因子 B のレベルの頻度で加重) を比較したいとします。 コントラスト係数を入力できます。

これらの係数は合計が 0 にならないことに注意してください。プログラムは、合計が 0 になるように係数を設定し、その相対値が保持されます。つまり、次のようになります。

1/3 2/3 -3/4 -1/4

これらの対比は、因子 A の加重平均を比較します。

主平均に関する仮説。重み付けされていない主平均が 0 であるという仮説は、係数を使用して調べることができます。

加重主平均が 0 であるという仮説は、以下を使用してテストされます。

いかなる場合でも、プログラムはコントラスト比を調整しません。

欠落セルのある計画(不完全な計画)の分析

空のセル(観測値のないセルの組み合わせを処理する)を含む要因計画は、不完全と呼ばれます。 このような設計では、通常、一部の因子が直交せず、一部の相互作用は計算できません。 一般に、このような計画を分析するのにこれより優れた方法はありません。

回帰アプローチ

多変量回帰を使用した分散分析計画の分析に依存する一部の古いプログラムでは、不完全な計画の因子が通常どおり (計画が完了しているかのように) デフォルトで指定されます。 次に、これらのダミー コード化因子に対して多変量回帰分析が実行されます。 残念ながら、この方法では、各効果が平均の線形結合にどのように寄与するかが不明瞭であるため、不可能ではないにしても、解釈が非常に困難な結果が生成されます。 次の簡単な例を考えてみましょう。

ファクターA ファクターB
B1 B2
A1 3 4, 5
A2 6, 6, 7 逃した

次の形式の多変量回帰を実行すると、 従属変数 = 定数 + 係数 A + 係数 Bの場合、平均値の線形結合に関する因子 A と B の重要性に関する仮説は次のようになります。

因子 A: セル A1、B1 = セル A2、B1

因子 B: セル A1、B1 = セル A1、B2

このケースは単純です。 より複雑な設計では、何を正確に検査するかを実際に決定することは不可能です。

セル平均、ANOVA アプローチ , タイプ IV の仮説

文献で推奨されており、望ましいと思われるアプローチは、(研究課題の観点から)意味のある研究を行うことです。 アプリオリ計画のセルで観察された平均値に関する仮説。 このアプローチの詳細な議論は、Dodge (1985)、Heiberger (1989)、Milliken and Johnson (1984)、Searle (1987)、または Woodward、Bonett、および Brecht (1990) にあります。 効果の一部の推定値を調べる不完全な計画における平均の線形結合に関する仮説に関連付けられた平方和は、平方和とも呼ばれます。 .

タイプ仮説の自動生成. 多変量計画に複雑な欠損セル パターンがある場合、その調査が主効果または相互作用の調査と同等である直交 (独立) 仮説を定義することが望ましいです。 このような比較に適した重みを生成するために、アルゴリズム (計算) 戦略 (擬似逆計画行列に基づく) が開発されています。 残念ながら、最終的な仮説は独自の方法で定義されるわけではありません。 もちろん、それらは影響が特定された順序に依存しており、単純な解釈が可能になることはほとんどありません。 したがって、欠落した細胞の性質を注意深く研究し、仮説を立てることをお勧めします。 タイプ, それは、研究の目的に最も有意義に対応しています。 次に、オプションを使用してこれらの仮説を検討します 計画された比較窓の中で 結果。 この場合に比較を指定する最も簡単な方法は、すべての要素のコントラストのベクトルの導入を要求することです。 一緒に窓の中で 計画的な比較。ダイアログボックスを呼び出した後 計画された比較現在の計画内のすべてのグループが表示され、欠落しているグループがマークされます。

欠落した細胞と特定の効果のテスト

欠落セルの位置がランダムではなく慎重に計画されており、他の効果に影響を与えることなく主効果を簡単に分析できる設計タイプがいくつかあります。 たとえば、プラン内の必要な数のセルが利用できない場合、プランがよく使用されます。 ラテン方陣多数のレベルを使用していくつかの要因の主効果を推定します。 たとえば、4 x 4 x 4 x 4 要因計画には 256 個のセルが必要です。 同時に使用できます グレコ・ラテン広場計画内のわずか 16 個のセルを使用して主効果を推定する (第 3 章) 実験計画、第 IV 巻には、そのような計画の詳細な説明が含まれています)。 平均値の単純な線形結合を使用して主効果 (および一部の交互作用) を推定できる不完全な計画は、不完全な計画と呼ばれます。 バランスのとれた不完全な計画.

バランス型計画では、主効果と交互作用のコントラスト (重み) を生成する標準 (デフォルト) 方法により、それぞれの効果の二乗和が互いに交絡しない分散分析表が生成されます。 オプション 具体的な効果結果欠落している計画セルにゼロを書き込むことによって、欠落しているコントラストを生成します。 オプションが要求された直後 具体的な効果ユーザーが何らかの仮説を検討している場合、結果の表が実際の重みとともに表示されます。 バランスの取れた計画では、対応する効果の二乗和は、それらの効果が他のすべての主効果および相互作用に対して直交している (独立している) 場合にのみ計算されることに注意してください。 それ以外の場合は、オプションを使用する必要があります 計画された比較平均値間の意味のある比較を調査します。

欠落しているセルとプールされた効果/エラー項

オプションの場合 回帰アプローチモジュールのスタートパネル内 分散分析が選択されていない場合、効果の二乗和を計算するときにセル平均モデルが使用されます (デフォルト設定)。 デザインのバランスが取れていない場合、非直交効果を組み合わせるとき (オプションに関する上記の説明を参照) 失われた細胞と具体的な影響) 非直交 (または重複) 成分からなる平方和を取得できます。 得られた結果は通常、解釈できません。 したがって、複雑で不完全な実験計画を選択して実装する場合は、細心の注意を払う必要があります。

さまざまな種類の計画について詳しく説明した本がたくさんあります。 (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken and Johnson, 1984; Searle, 1987; Woodward and Bonett, 1990) しかし、この種の情報はこの教科書の範囲を超えています。 ただし、さまざまなタイプの計画の分析については、このセクションの後半で説明します。

仮定と仮定に違反した場合の影響

正規分布の仮定からの逸脱

従属変数が数値スケールで測定されると仮定します。 また、従属変数が各グループ内に正規分布していると仮定します。 分散分析には、この仮定を裏付けるさまざまなグラフと統計が含まれています。

混乱の影響。まったく Fこのテストは正規性からの逸脱に対して非常に堅牢です (詳細な結果については、Lindman、1974 を参照)。 尖度が 0 より大きい場合、統計値は次のようになります。 F非常に小さくなる可能性があります。 帰無仮説は、真実ではない可能性がありますが、受け入れられます。 尖度が 0 未満の場合、状況は逆転します。通常、分布の歪度はほとんど影響しません。 F統計。 セル内の観測値の数が十分に大きい場合、次の理由により正規性からの逸脱は特に大きくありません。 中心極限定理これによれば、初期分布に関係なく、平均値の分布は正規に近くなります。 持続可能性に関する詳細な議論 F統計は、Box and Anderson (1955) または Lindman (1974) に記載されています。

分散の均一性

仮定。異なる設計グループの分散は同じであると仮定されます。 この仮定を仮定といいます 分散の均一性。このセクションの冒頭で二乗誤差の合計の計算を説明したときに、各グループ内で合計を実行したことを思い出してください。 2 つのグループの分散が互いに異なる場合、それらを合計することはあまり自然ではなく、グループ内の合計分散の推定値は得られません (この場合、合計分散はまったく存在しないため)。 モジュール 分散分析 -分散分析/マノバには、分散の均一性の仮定からの逸脱を検出するための多数の統計基準が含まれています。

混乱の影響。リンドマン (1974、p. 33) は次のことを示しています。 Fこの基準は、分散の均一性の仮定の違反に関して非常に安定しています ( 異質性差異、Box、1954a、1954b も参照。 スー、1938)。

特殊なケース: 平均と分散の相関。というときもあります。 F統計はできる 誤解を招く。これは、計画セルの平均が分散と相関している場合に発生します。 モジュール 分散分析を使用すると、平均に対する分散または標準偏差の散布図をプロットして、そのような相関関係を検出できます。 この相関関係が危険である理由は次のとおりです。 計画に 8 つのセルがあり、そのうち 7 つの平均がほぼ同じで、1 つのセルの平均が他のセルよりもはるかに高いと想像してください。 それから Fこのテストにより、統計的に有意な効果が検出される可能性があります。 しかし、平均値が大きいセルでは、分散が他のセルよりも大幅に大きいと仮定します。 セルの平均値と分散は依存しています (平均が高いほど、分散も大きくなります)。 この場合、平均値が大きいということは、データのばらつきが大きいことが原因である可能性があるため、信頼性がありません。 しかし Fに基づく統計 ユナイテッドセル内の分散は総平均を捕捉しますが、各セル内の分散に基づく検定では平均値のすべての差異が有意であるとはみなされません。

このタイプのデータ (大きな平均と大きな分散) は、外れ値の観測がある場合によく発生します。 1 つまたは 2 つの外れ値の観測があると、平均が大きく変化し、分散が大幅に増加します。

分散と共分散の均一性

仮定。多変量依存測度を使用した多変量計画では、前述の分散均一性の仮定も適用されます。 ただし、多変量の従属変数があるため、それらの相互相関 (共分散) が計画のすべてのセルにわたって均一であることも必要です。 モジュール 分散分析は、これらの仮定をテストするさまざまな方法を提供します。

混乱の影響. 多次元アナログ F- 基準 - ウィルクスの λ 検定。 上記の仮定の違反に関するウィルクスの λ テストの堅牢性についてはあまり知られていません。 ただし、モジュールの解釈結果は 分散分析通常、(一般基準の有意性を確立した後)単変量効果の有意性に基づいており、ロバスト性の議論は主に単変量分散分析に関係します。 したがって、単変量効果の重要性は慎重に検討する必要があります。

特殊なケース: 共分散分析。共変量が計画に含まれている場合、特に重大な分散/共分散均一性違反が発生する可能性があります。 特に、共変量と従属測度の間の相関関係が計画内のセル間で異なる場合、結果の誤解が生じる可能性があります。 共分散分析では基本的に、各セル内で回帰分析を実行して、共変量によって説明される分散の部分を分離することに注意してください。 分散/共分散の均一性の仮定では、この回帰分析が次の制約の下で実行されることを前提としています。つまり、すべてのセルのすべての回帰方程式 (傾き) が同じです。 これが想定されていない場合、大きな誤差が生じる可能性があります。 モジュール 分散分析には、この仮定をテストするための特別な基準がいくつかあります。 異なるセルの回帰式がほぼ同じであることを確認するには、これらの基準を使用することをお勧めします。

球形性と複雑な対称性: 分散分析における反復測定に多変量アプローチを使用する理由

3 水準以上の反復測定因子を含む計画では、一変量分散分析を使用するには、複合対称性の仮定と球形性の仮定という追加の仮定が必要です。 これらの仮定が満たされることはほとんどありません (以下を参照)。 したがって、近年、このような設計では多変量分散分析が人気を集めています (両方のアプローチがモジュールで組み合わされています) 分散分析).

複素対称性の仮定複合対称性の仮定は、異なる反復測定の分散 (グループ内で共有) と共分散 (グループ内で共有) が均一 (同じ) であるということです。 これは、反復測定の一変量 F 検定が有効であるための十分条件です (つまり、報告された F 値は平均して F 分布と一致します)。 ただし、この場合、この条件は必要ありません。

球面度の仮定。球形性の仮定は、F 検定が有効であるための必要十分条件です。 それは、グループ内ではすべての観測値が独立しており、均等に分散されているという事実にあります。 これらの仮定の性質と、それらに違反した場合の影響は、通常、ANOVA に関する書籍では詳しく説明されていません。これらについては、次の段落で説明します。 また、単変量アプローチの結果が多変量アプローチの結果とは異なる可能性があることも示され、これが何を意味するかについて説明されます。

仮説の独立性の必要性。 ANOVA でデータを分析する一般的な方法は次のとおりです。 モデルフィッティング。 データに適合するモデルと比較して、 アプリオリ仮説を作成し、分散を分割してこれらの仮説を検定します (主効果、交互作用の基準)。 計算の観点から見ると、このアプローチは一連のコントラスト (計画平均の一連の比較) を生成します。 ただし、コントラストが互いに独立していない場合、分散の分割は無意味になります。 たとえば、2 つの対照がある場合、 そして Bが同一であり、分散の対応する部分が抽出されると、同じ部分が 2 回抽出されます。 たとえば、「セル 1 の平均はセル 2 の平均よりも高い」と「セル 1 の平均はセル 2 の平均よりも高い」という 2 つの仮説を特定するのは愚かで無意味です。 したがって、仮説は独立しているか直交している必要があります。

反復測定における独立した仮説。モジュールに実装された一般的なアルゴリズム 分散分析、各エフェクトに対して独立した(直交する)コントラストを生成しようとします。 反復測定要因に関して、これらの対比は、次の点に関する多くの仮説を提供します。 違い考慮中の因子の水準間。 ただし、これらの違いがグループ内で相関している場合、結果として得られるコントラストは独立ではなくなります。 たとえば、1 学期に生徒の測定を 3 回行う指導では、1 回目と 2 回目の測定の間の変化が、被験者の 2 回目と 3 回目の測定の間の変化と負の相関関係にあることが起こります。 1 次元と 2 次元の間でほとんどの内容を習得した人は、2 次元と 3 次元の間で経過した時間の間に、より小さな部分を習得します。 実際、ANOVA が反復測定に使用されるほとんどの場合、レベル間の変化は被験者間で相関していると想定できます。 しかし、これが起こると、複素対称性の仮定と球形性の仮定が成り立たなくなり、独立したコントラストを計算することができなくなります。

違反の影響と違反を修正する方法。複雑な対称性または球形性の仮定が満たされない場合、ANOVA は誤った結果を生成する可能性があります。 多変量手順が十分に開発される前に、これらの仮定の違反を補うためにいくつかの仮定が提案されました。 (例えば、Greenhouse & Geisser、1959 年および Huynh & Feldt、1970 年を参照)。 これらのメソッドは今でも広く使用されています (このため、モジュールで紹介されています) 分散分析).

反復測定に対する多変量分散分析アプローチ。一般に、複雑な対称性と球形性の問題は、反復測定因子の効果の研究に含まれるコントラストのセット (2 レベル以上) が互いに独立していないという事実に関連しています。 ただし、使用する場合は独立している必要はありません。 多次元 2 つ以上の反復測定因子のコントラストの統計的有意性を同時にテストするテスト。 これが、2 水準を超える単変量反復測定因子の有意性を検定するために多変量分散分析手法がますます使用されるようになった理由です。 このアプローチは、一般に複雑な対称性や球形性を必要としないため、広く受け入れられています。

多変量分散分析アプローチが使用できないケース。多変量分散分析アプローチを適用できない例 (設計) があります。 これらは通常、計画内の対象数が少なく、反復測定係数のレベルが多い場合に発生します。 その場合、多変量解析を実行するには観測値が少なすぎる可能性があります。 たとえば、被験者が 12 人いる場合、 p = 4 反復測定要因、および各要因には k = 3 レベル。 そして、4つの要素の相互作用により「消費」されます。 (k-1)P = 2 4 = 16 自由度。 ただし、被験者が 12 人しかいないため、この例では多変量テストを実行できません。 モジュール 分散分析これらの観測値を個別に検出し、1 次元の基準のみを計算します。

単変量結果と多変量結果の違い。研究に多数の反復測定が含まれる場合、単変量反復測定 ANOVA アプローチでは、多変量アプローチで得られる結果とは大きく異なる結果が生成される場合があります。 これは、対応する反復測定のレベル間の差異が被験者間で相関していることを意味します。 場合によっては、この事実が独立した関心を引く場合もあります。

多変量分散分析と構造方程式モデリング

近年、多変量分散分析の代替として構造方程式モデリングが普及してきました(たとえば、Bagozzi and Yi, 1989; Bagozzi, Yi, and Singh, 1991; Cole, Maxwell, Arvey, and Salas, 1993 を参照)。 。 このアプローチにより、異なるグループの平均だけでなく、従属変数の相関行列についても仮説を検証することができます。 たとえば、分散と共分散の均一性の仮定を緩和し、各グループのモデルに誤差の分散と共分散を明示的に含めることができます。 モジュール 統計構造方程式モデリング (SEPATH)) (第 3 巻を参照)このような分析が可能になります。

このノートでの統計の使用法について、横断的な例を示して説明します。 あなたが Perfect Parachute の制作マネージャーだとしましょう。 パラシュートは 4 つの異なるサプライヤーから供給される合成繊維で作られています。 パラシュートの主な特徴の 1 つはその強度です。 供給されるすべてのファイバーが同じ強度であることを確認する必要があります。 この質問に答えるには、さまざまなサプライヤーの合成繊維で織られたパラシュートの強度を測定するための実験計画を設計する必要があります。 この実験から得られた情報により、どのサプライヤーが最も耐久性のあるパラシュートを提供するかが決まります。

多くのアプリケーションには、単一の因子の複数のグループまたはレベルを考慮する実験が含まれます。 セラミックの焼成温度などの一部の要素には、複数の数値レベル (つまり、300°、350°、400°、450°) がある場合があります。 スーパーマーケット内の商品の場所などの他の要因には、カテゴリレベル (たとえば、第 1 サプライヤー、第 2 サプライヤー、第 3 サプライヤー、第 4 サプライヤー) がある場合があります。 実験単位がグループまたは因子レベルにランダムに割り当てられる単一因子実験は、完全ランダム化と呼ばれます。

使用法F- いくつかの数学的期待間の差異を評価するための基準

グループ内の因子の数値測定が連続的で、いくつかの追加条件が満たされる場合、分散分析 (ANOVA) を使用して、いくつかのグループの数学的期待値が比較されます。 アン分析 ああ f バージニア州リアンス)。 完全にランダム化された計画を使用した分散分析は、一元配置分散分析手順と呼ばれます。 ある意味、分散分析という用語は、分散間の差異ではなく、グループの期待値間の差異を比較するため、誤った呼び名です。 ただし、数学的期待値の比較は、データ変動の分析に基づいて正確に実行されます。 ANOVA 手順では、測定結果のばらつきの合計がグループ間とグループ内に分割されます (図 1)。 グループ内の変動は実験誤差によって説明され、グループ間の変動は実験条件の影響によって説明されます。 シンボル はグループの数を表します。

米。 1. 完全にランダム化された実験における分割の変動

または形式でメモをダウンロード、形式で例をダウンロード

そのふりをしてみましょう グループは、正規分布と等しい分散を持つ独立した母集団から抽出されます。 帰無仮説は、母集団の数学的期待が同じであるということです。 H 0: μ 1 = μ 2 = ... = μ s。 対立仮説は、すべての数学的期待が同じではないことを示しています。 H1: すべてのμ j が同じではありません j= 1、2、…、s)。

図では、 図 2 は、母集団が正規分布で分散が同じであると仮定した場合の、5 つの比較グループの数学的期待値に関する真の帰無仮説を示しています。 因子の異なるレベルに関連付けられた 5 つの集団は同一です。 その結果、それらは同じ数学的期待、変化、形状を持ち、互いに重ね合わされます。

米。 2. 5 つの一般母集団は同じ数学的期待値を持っています。 μ 1 = μ 2 = μ 3 = μ 4 = μ 5

一方、実際には帰無仮説が偽で、第 4 レベルの期待値が最も高く、第 1 レベルの期待値がわずかに低く、残りのレベルの期待値は同じかさらに低いとします (図3)。 期待値を除いて、5 つの母集団はすべて同一である (つまり、同じ変動性と形状を持つ) ことに注意してください。

米。 3. 実験条件の影響が観察されます。 μ 4 > μ 1 > μ 2 = μ 3 = μ 5

いくつかの一般母集団の数学的期待値が等しいという仮説を検証する場合、全体の変動は 2 つの部分に分割されます。グループ間の差異に起因するグループ間変動と、同じグループに属する要素間の差異に起因するグループ内変動です。 変動の合計は平方和の合計 (SST – 合計平方和) で表されます。 帰無仮説は、すべての人の数学的期待値であるため、 グループが互いに等しい場合、変動の合計は、個々の観測値間の差の二乗の合計と、すべてのサンプルについて計算された全体の平均 (平均の平均) に等しくなります。 フルバリエーション:

どこ - 全体平均、 X ij - -e での観察 j- グループまたはレベル、 n j- の観測数 j番目のグループ、 n- すべてのグループの観測値の合計数 (すなわち、 n = n 1 + n2 + … + n c), - 学習したグループまたはレベルの数。

グループ間の変動通常、グループ間平方和 (SSA - グループ間の平方和) と呼ばれ、各グループのサンプル平均間の差の平方和に等しくなります。 jそして全体の平均 、対応するグループのボリュームを乗算 n j:

どこ - 学習したグループまたはレベルの数、 n j- の観測数 j番目のグループ、 j- 平均値 j番目のグループ、 - 全体的な平均。

グループ内変動通常、グループ内平方和 (SSW - グループ内の平方和) と呼ばれ、各グループの要素とこのグループのサンプル平均の差の平方和に等しくなります。 j:

どこ バツij - 番目の要素 j番目のグループ、 j- 平均値 j番目のグループ。

比較されるので 因子水準、グループ間の二乗和は次のようになります。 s – 1自由度。 それぞれの レベルは n j – 1 自由度があるため、グループ内の二乗和は次のようになります。 n- と自由度、そして

また、平方和の総和は、 n – 1 各観測以来の自由度 バツijすべてにわたって計算された全体平均と比較されます。 n観察。 これらの合計を対応する自由度の数で割ると、次の 3 種類の分散が生じます。 グループ間(平均二乗 - MSA)、 グループ内(MSW内の平均二乗)および 満杯(平均二乗合計 - MST):

分散分析の主な目的は数学的期待値を比較することであるにもかかわらず、 実験条件の影響を特定するためにグループを使用するもので、その名前の由来は、主なツールがさまざまな種類の分散分析であるという事実によるものです。 帰無仮説が真であり、数学的期待の間にある場合 グループには有意な差はなく、3 つの分散 (MSA、MSW、MST) はすべて分散推定値です。 σ 2分析されたデータに固有のものです。 したがって、帰無仮説を検定するには H 0: μ 1 = μ 2 = ... = μ sそして対立仮説 H1: すべてのμ j が同じではありません j = 1, 2, …, )、統計を計算する必要があります F- 基準。これは 2 つの分散、MSA と MSW の比です。 テスト F-一元配置分散分析の統計

統計 F-基準の対象となる F-との配布 s – 1分子の自由度 M.S.A.そして n – s分母の自由度 M.S.W.。 与えられた有意水準 α について、計算された値が α である場合、帰無仮説は棄却されます。 F FU、 固有の F-との配布 s – 1 n – s分母の自由度。 したがって、図に示すように、 4、決定ルールは次のように定式化されます: 帰無仮説 H0拒否された場合 F>FU; それ以外の場合は拒否されません。

米。 4. 仮説を検証する際の分散分析の重要な領域 H0

帰無仮説の場合 H0それは真実です、計算されたものです F-統計量は、その分子と分母が同じ量、つまり分析されたデータに固有の分散 σ 2 の推定値であるため、1 に近くなります。 帰無仮説の場合 H0は偽です (そして、異なるグループの数学的期待の間には大きな違いがあります)、計算されます F- 統計量は 1 よりもはるかに大きくなります。これは、分子の MSA がデータの自然変動に加えて、実験条件の影響やグループ間の差異を推定するのに対し、分母の MSW はデータの自然変動のみを推定するためです。 。 したがって、ANOVA 手順は次のようになります。 F- 所定の有意水準 α において、計算された値が次の場合に帰無仮説が棄却される基準 F-統計が上限臨界値より大きい FU、 固有の F-との配布 s – 1分子の自由度、および n – s図に示すように、分母の自由度。 4.

一元配置分散分析を説明するために、このメモの冒頭で概説したシナリオに戻りましょう。 実験の目的は、異なるサプライヤーから入手した合成繊維で織られたパラシュートが同じ強度を持つかどうかを判断することです。 各グループには 5 つのパラシュートがあります。 グループはサプライヤー 1、サプライヤー 2、サプライヤー 3、サプライヤー 4 によって分類されます。パラシュートの強度は、生地の両面の破れをテストする特別な装置を使用して測定されます。 パラシュートを破壊するのに必要な力は特別なスケールで測定されます。 破壊力が大きいほど、パラシュートは強くなります。 Excelを使えば分析できる F-ワンクリックで統計。 メニューを確認する データデータ分析をクリックして、行を選択します 一元配置分散分析、開いたウィンドウに記入します (図 5)。 実験結果 (破断強度)、いくつかの記述統計、および一元配置分散分析の結果を図に示します。 6.

米。 5. ウィンドウ 一元配置分散分析パッケージエクセル

米。 6. さまざまなサプライヤーから入手した合成繊維で織られたパラシュートの強度指標、記述統計および一元配置分散分析の結果

図 6 の分析では、標本の平均値の間に何らかの差異があることが示されています。 最初のサプライヤーから得られた繊維の平均強度は 19.52、2 番目のサプライヤーからは 24.26、3 番目のサプライヤーからは 22.84、4 番目のサプライヤーからは 21.16 でした。 この違いは統計的に有意ですか? 破断力の分布は散布図に示されています (図 7)。 グループ間およびグループ内での違いが明確に示されています。 各グループのサイズが大きい場合は、幹葉図、箱ひげ図、またはベル プロットを使用して分析できます。

米。 7. 4 つのサプライヤーから入手した合成繊維で織られたパラシュートの強度分散の図。

帰無仮説は、平均強度スコア間に有意な差はないと述べています。 H 0: μ 1 = μ 2 = μ 3 = μ 4。 代替仮説は、繊維の平均強度が他のサプライヤーと異なるサプライヤーが少なくとも 1 社存在するというものです。 H1: すべてのμ j が同じではありません ( j = 1, 2, …, ).

全体の平均 (図 6 を参照) = 平均(D12:D15) = 21.945; 決定するには、元の 20 個の数値すべてを平均することもできます: = AVERAGE(A3:D7)。 分散値が計算されます 分析パッケージそしてプレートに反映されます 分散分析(図 6 を参照): SSA = 63.286、SSW = 97.504、SST = 160.790 (コラムを参照) SSテーブル 分散分析図6)。 平均は、これらの平方和を適切な自由度の数で割ることによって計算されます。 なぜなら = 4、a n= 20、次の自由度の値が得られます。 SSAの場合: s – 1= 3; SSWの場合: n–c= 16; SSTの場合: n – 1= 19 (コラムを参照) DF)。 したがって、MSA = SSA / ( s – 1)= 21.095; MSW = SSW / ( n–c) = 6.094; MST = SST / ( n – 1) = 8.463 (コラムを参照) MS). F-統計 = MSA / MSW = 3.462 (コラムを参照) F).

上限臨界値 FU、の特徴 F-分布、式 =F.OBR(0.95;3;16) = 3.239 によって決定されます。 関数 =F.OBR() のパラメーター: α = 0.05、分子の自由度は 3、分母は 16 です。したがって、計算された F- 3.462 に等しい統計が上限臨界値を超えています FU= 3.239、帰無仮説は棄却されます (図 8)。

米。 8. 分子の自由度が 3 で分母が -16 の場合、有意水準 0.05 の分散分析の臨界領域

R-値、つまり 帰無仮説が正しい場合の確率 F-統計値は 3.46 以上、0.041 または 4.1% に相当 (コラムを参照) p値テーブル 分散分析図6)。 この値は有意水準 α = 5% を超えないため、帰無仮説は棄却されます。 さらに、 R-value は、一般母集団の数学的期待値が実際に同じである場合に、その差以上の差異を検出する確率が 4.1% に等しいことを示します。

それで。 4 つのサンプル平均値の間には差があります。 帰無仮説は、4 つの母集団の数学的期待値がすべて等しいというものでした。 これらの条件下では、すべてのパラシュートの強度の合計変動 (つまり、合計 SST 変動) の尺度は、各観測値間の差の 2 乗を合計することによって計算されます。 X ijそして全体の平均 。 次に、全体の変動が 2 つの要素に分離されました (図 1 を参照)。 最初の成分は SSA のグループ間変動であり、2 番目の成分は SSW のグループ内変動でした。

データのばらつきは何で説明されるのでしょうか? 言い換えれば、なぜすべての観察が同じではないのでしょうか? 理由の 1 つは、異なる企業が異なる強度の繊維を供給していることです。 これは、グループが異なる数学的期待を持つ理由の一部を説明します。実験条件の効果が強いほど、グループの数学的期待の差が大きくなります。 データが変動するもう 1 つの理由は、プロセス (この場合はパラシュートの製造) の自然な変動です。 たとえすべての繊維が同じ供給者から購入されたとしても、他のすべての条件が同じであれば、その強度は同じではありません。 この効果は各グループ内で発生するため、グループ内変動と呼ばれます。

サンプル平均間の差はグループ間変動 SSA と呼ばれます。 すでに示したように、グループ内変動の一部は、データが異なるグループに属していることで説明されます。 ただし、グループがまったく同じである場合 (つまり、帰無仮説が真である場合)、グループ間の変動は依然として存在します。 その理由は、パラシュートの製造プロセスの自然なばらつきにあります。 サンプルが異なるため、サンプル平均値は互いに異なります。 したがって、帰無仮説が真である場合、グループ間およびグループ内の変動の両方が母集団の変動の推定値を表します。 帰無仮説が偽の場合、グループ間仮説の方が大きくなります。 根底にあるのはこの事実です F- いくつかのグループの数学的期待間の差異を比較するための基準。

一元配置分散分析を実行し、企業間の大きな違いが見つかった後でも、どのサプライヤーが他のサプライヤーと大きく異なるのかは不明のままです。 私たちが知っているのは、一般集団の数学的期待が平等ではないということだけです。 言い換えれば、数学的期待値の少なくとも 1 つは、他のものとは大きく異なります。 どのサプライヤーが他のサプライヤーと異なるかを判断するには、次を使用できます。 テューキー手順、サプラ​​イヤー間のペアごとの比較を使用します。 この手順は John Tukey によって開発されました。 その後、彼と K. Kramer は、サンプル サイズが互いに異なる状況に合わせてこの手順を独立して修正しました。

多重比較: Tukey-Kramer 法

私たちのシナリオでは、パラシュートの強度を比較するために一元配置分散分析が使用されました。 4 つのグループの数学的期待間に大きな違いがあることがわかったので、どのグループが互いに異なるかを判断する必要があります。 この問題を解決するにはいくつかの方法がありますが、ここでは Tukey-Kramer 多重比較手順についてのみ説明します。 この方法は、テスト対象の仮説がデータ分析後に定式化されるため、事後比較手順の一例です。 Tukey-Kramer 手順を使用すると、グループのすべてのペアを同時に比較できます。 最初の段階で差が計算されます バツj -バツj、 どこ j ≠j、数学的期待の間 s(s – 1)/2グループ。 重要な範囲 Tukey-Kramer 手順は次の式で計算されます。

どこ QU- スチューデント化された範囲分布の上限臨界値。 分子の自由度、および n - と分母の自由度。

サンプルサイズが同じでない場合、臨界範囲は数学的期待値のペアごとに個別に計算されます。 最終段階ではそれぞれが、 s(s – 1)/2数学的期待値のペアが、対応する臨界範囲と比較されます。 差の係数 | が次の場合、ペアの要素は著しく異なると見なされます。 Xj -バツj| それらの間が臨界範囲を超えています。

Tukey-Kramer の手順をパラシュートの強度の問題に適用してみましょう。 パラシュート会社には 4 つのサプライヤーがあるため、4(4 – 1)/2 = 6 組のサプライヤーをチェックする必要があります (図 9)。

米。 9. サンプル平均値のペアごとの比較

すべてのグループのボリュームは同じであるため(つまり、すべてのグループ) n j = n j)、臨界範囲を 1 つだけ計算するだけで十分です。 これを行うには、表に従って 分散分析(図 6) MSW = 6.094 という値を決定します。 次に、値を見つけます QUα = 0.05の場合、 = 4 (分子の自由度の数)、および n- と= 20 – 4 = 16 (分母の自由度の数)。 残念ながら Excel には対応する関数が見つからなかったので、表を使用しました (図 10)。

米。 10. スチューデント化範囲の臨界値 QU

我々が得る:

4.74 > 4.47 のみであるため (図 9 の下の表を参照)、最初のサプライヤーと 2 番目のサプライヤーの間には統計的に有意な差が存在します。 他のすべてのペアにはサンプル平均があり、その違いについて話すことはできません。 その結果、最初のサプライヤーから購入した繊維で織られたパラシュートの平均強度は、2 番目のサプライヤーよりも大幅に低くなります。

一元配置分散分析の必要条件

パラシュートの強度の問題を解決する際、ワンファクターを使用できる条件が揃っているかどうかを確認しませんでした。 F-基準。 1 要素を使用できるかどうかはどうすればわかりますか F-特定の実験データを分析するときの基準は? 単一要因 F- 基準は 3 つの基本的な仮定が満たされる場合にのみ適用できます。実験データはランダムで独立している必要があり、正規分布を持ち、分散が等しい必要があります。

最初の推測 - ランダム性とデータの独立性- 実験の正しさは選択のランダム性やランダム化プロセスに依存するため、常に実行する必要があります。 結果の偏りを避けるためには、データを次から抽出する必要があります。 一般集団をランダムかつ互いに独立して抽出します。 同様に、データはランダムに分散される必要があります。 関心のある因子のレベル (実験グループ)。 これらの条件に違反すると、分散分析の結果が大きく歪む可能性があります。

2番目の推測 - 正常- データが正規分布した母集団から抽出されたことを意味します。 はどうかと言うと t-基準、以下に基づく一元配置分散分析 F-基準は、この条件の違反に対して比較的敏感ではありません。 分布が正規分布から大きく外れていない場合、有意水準は F-特にサンプルサイズが十分に大きい場合、基準はほとんど変わりません。 分布の正規性の条件が著しく違反されている場合には、それを適用する必要があります。

3番目の推測 - 分散の均一性- は、各母集団の分散が互いに等しいことを意味します (つまり、σ 1 2 = σ 2 2 = ... = σ j 2)。 この仮定により、グループ内の分散を分離するかプールするかを決定できます。 グループのサイズが同じ場合、分散の均一性の条件は、次の方法を使用して得られる結論にほとんど影響を与えません。 F-基準。 ただし、サンプルサイズが等しくない場合、分散の等価条件に違反すると、分散分析の結果が大きく歪む可能性があります。 したがって、サンプルサイズが等しいことを確認するための努力が必要です。 分散の均一性の仮定をチェックする方法の 1 つは、基準です。 レヴィン以下で説明します。

3 つの条件すべてのうち、分散の均一性の条件のみに違反した場合は、次のような手順が実行されます。 t- 個別の分散を使用する基準 (詳細については、を参照してください)。 ただし、正規分布と分散の均一性の仮定が同時に破られる場合は、データを正規化して分散間の差を減らすか、ノンパラメトリック手順を適用する必要があります。

分散の均一性を検定するための Levene の検定

それでも F- この基準は、グループ内の分散の等しさの条件の違反に対して比較的耐性があります。この仮定に大きく違反すると、基準の重要性と検出力のレベルに大きな影響を与えます。 おそらく最も強力なものの 1 つは、次の基準です。 レヴィン。 分散の等価性をチェックするには 一般集団を対象として、次の仮説をテストします。

Н 0: σ 1 2 = σ 2 2 = … = σj 2

H1: すべてではない σ j 2同じだ ( j = 1, 2, …, )

修正された Levene の検定は、グループ内の変動が同じである場合、観測値とグループの中央値の間の差の絶対値の分散分析を使用して、分散が等しいという帰無仮説を検定できるという記述に基づいています。 したがって、まず各グループの観測値と中央値の差の絶対値を計算し、次に、結果として得られる差の絶対値に対して一元配置分散分析を実行する必要があります。 Levene の基準を説明するために、メモの冒頭で概説したシナリオに戻りましょう。 図に示されているデータを使用します。 6では、同様の分析を実行しますが、各サンプルの初期データと中央値の差のモジュールに関連して個別に実行します(図11)。

このセクションの最新資料:

行間を聞く 行間から読み取られる表現は何を意味するのでしょうか?
行間を聞く 行間から読み取られる表現は何を意味するのでしょうか?

行間を読む 行間(外国語)を読んで、書かれていないことや合意されていないことを推測します。 結婚した。 しかし、彼の痛ましいセリフの間には...

グラフ作成のルール
グラフ作成のルール

グラフは量間の関係を視覚的に表現します。これは、取得したデータを解釈する際に非常に重要です。

ロシア初の世界一周旅行
ロシア初の世界一周旅行

ロシアの航海士は、ヨーロッパの航海士と並んで、新大陸、山脈の一部、広大な大陸を発見した最も有名な先駆者です。