はじめに
エクセルには、アドオンの「データ分析」ツールの中に一元配置分散分析ができる機能があります。
下にテンプレート(セルデータサンプル)があるので、
一元配置分散分析とは
分散分析(ANOVA, Analysis of Variance)とは、「3つ以上 の群(グループ)の母平均の間に有意差があるか」を判定する統計的仮説検定の1つです。
分散分析表を作成することで、p値が算出されます。
いつ使うのか?
一元配置分散分析は、以下のような場合に使用します。
- データが量的データである。
- データが3つ以上のグループに分かれている。
- 各群のデータは正規分布に従う(正規性)。
- 各群の分散は等しい(等分散性)。
- 各群のデータは独立である(当分酸性)。
算出値の意味
仮説検定では、 p値 を算出し、 有意水準α と比較を行います。
p値 と 有意水準α による判定は以下の通りです。
- p値 < α のとき: 各群の母平均の間に有意な差が ある
- p値 ≥ α のとき: 各群の母平均の間に有意な差が ない
「どの群の間に有意差があるか」はわからない
一元配置分散分析では、「いずれか or すべての群の間に有意差があるかどうか」までしかわかりません。
「どの群の間に有意差があるか」を知るには、多重比較検定を行う必要があります。
エクセルでの算出方法
以下の 全セルをコピー ボタンをクリックし、エクセルの A1 セルに貼り付けると、
データを書き換える場合は、
算出手順
エクセルで一元配置分散分析を行うための手順は、以下の4つです。
1. パラメータの設定
有意水準αを 事前 に設定します。
2. 偏差平方和の算出
データセットの各列(群)の偏差平方和を算出します。
数値1, 数値2, ... )数値1の各データと平均との差(偏差)の二乗の総和(偏差平方和)を算出する。
数値2, 数値3, ... を追加することで、計算に用いるデータを増やすことができる(最大 : 数値配列255)。
数値1数値2 , ... 3. 分散分析表の作成
データおよび手順2の結果を使用して、分散分析表を作成します。
以下で、各列ごとに作成手順を説明します。
a. 変動平方和の列の作成
この列の各行には、以下の通りに記入します。
- 群間 の行: =F11-F10 ( 群内 の値 - 全体 の値)
- 群内 の行: =SUM(E5:G5)(手順2のの結果の合計)
- 全体 の行: =DEVSQ(A:C)(データ全体の偏差平方和)
b. 自由度の列の作成
この列の各行には、以下の通りに記入します。
- 群間 の行: =COUNT(A3:C3)-1( 群の数 - 1)
- 群内 の行: =COUNT(A:C)-COUNT(A3:C3)( 全データ数 - 群の数 )
- 全体 の行: =COUNT(A:C)-1( 全データ数 - 1)
c. 平均平方の列の作成
平均平方とは、変動平方和に対応する自由度で割った値です。
- 群間 の行: =F9/G9( 群の数 - 1)
- 群内 の行: =F10/G10( 全データ数 - 群の数 )
d. F値の算出
F値は、平均平方(手順cで算出)の比です。
- F値: =H9/H10
e. p値の算出
ここまでに算出したF値と、データの自由度を F.DIST.RT()関数に使い、p値を算出します。
- p値: =F.DIST.RT(I9,G9,G10)
x, 自由度1, 自由度2)F分布上で、指定したF値(x)の上側累積確率(右側確率)を返す
(F検定で計算したF値(x)から、p値が得られる)。
x自由度1自由度24. 結果の表示
設定した有意水準と、算出したp値を比較した結果を表示します。
論理式, TRUE時の値, FALSE時の値)論理式の値が TRUE か FALSE かに応じて分岐 し、
それぞれに対応した値 (TRUE時の値 / FALSE時の値) を返す。
論理式TRUE時の値FALSE時の値