エクセルで母分散の信頼区間の簡単な求め方【コピペですぐに使える】

はじめに
エクセルで母分散の区間推定を行うことができます。 CHISQ.INV
関数を使った計算で算出できます。
下にサンプルのセルデータがあるので、
母分散の信頼区間とは
信頼区間は、ある一定の確率で母集団の真の値が存在する区間のこと です。
- 具体例:「母分散の95%信頼区間は 」=「母分散が95%の確率で に存在する」
いつ使うのか?
手元にあるサンプル(標本)データから、母集団の分散値を推定する際に使用します。
エクセルでの算出方法
以下の 全セルをコピー
ボタンをクリックし、エクセルの A1
セルに貼り付けると、 D13
、D14
セルに母分散の95%信頼区間の上下限(下記の場合 20.64330496
, 0.897401296
)が算出されます。
A
列のデータを書き換え、 D4
、D5
セル中の参照範囲を書き換えることで、
D2
セルの値を 0.99
に変更すると、99%信頼区間が算出されます。
A | B | C | D | E | |
1 | データ | ||||
2 | X | 信頼度(信頼係数) | 0.95 | ||
3 | 11 | ||||
4 | 12 | 不偏分散 | =VAR.S(A3:A7) | ||
5 | 13 | サンプル数 | =COUNT(A3:A7) | ||
6 | 14 | ||||
7 | 15 | α | =1-D2 | ||
8 | 自由度 | =D5-1 | |||
9 | χ^2 (下側確率) | =CHISQ.INV($D$7/2,D8) | |||
10 | χ^2 (上側確率) | =CHISQ.INV(1-$D$7/2,D8) | |||
11 | |||||
12 | 信頼区間 | ||||
13 | 上限 | =$D$4*($D$8)/$D$9 | |||
14 | 下限 | =$D$4*($D$8)/$D$10 |
算出手順
エクセルで信頼区間の上限・下限を算出するための手順は以下の4つです。
1. パラメータを設定
計算に使用するパラメータを設定します。
- 信頼度(信頼係数): 信頼区間の信頼度。0.95を設定すると95%信頼区間が算出される。
2. データの基本統計量を算出
データから不偏分散、サンプル数(データ数)を算出します。
- 不偏標準偏差:
VAR.S
関数 - サンプル数(データ数):
COUNT
関数
3. カイ二乗値を算出
信頼区間の算出(手順4)で使用するカイ二乗()の値を算出します。
3a. αと自由度を算出
カイ二乗値の算出に必要な以下の2つの値を算出します。
- α = 1 - 信頼度(信頼係数)
- 自由度 = サンプル数(データ数)- 1
3b. カイ二乗値を算出
CHISQ.INV
関数を使用して、カイ二乗値を算出します。 CHISQ.INV
関数では、カイ二乗分布の 下側確率(左側確率) を指定する必要があるため、
- 下限に対応する値:
α/2
(95%信頼度のとき 0.025) - 上限に対応する値:
1-α/2
(95%信頼度のとき 0.975)
CHISQ.INV関数
第2引数の自由度のカイ二乗分布のときの、第1引数の確率に対応するカイ二乗値を返す。
ここでの確率は、カイ二乗分布の下側確率(左側確率)を表す。例:
=CHISQ.INV(1-D7/2,D8)
- 第1引数 (
1-D7/2
): カイ二乗分布の下側確率(必須)- 第2引数 (
D8
): 自由度(サンプル数-1)(必須)
4. 信頼区間の上限・下限を算出
手順2, 3で算出した値を使い、信頼区間の上限・下限値を算出します。
- 信頼区間の上限(下限):
不偏分散
× (カイ二乗値
/自由度
)