エクセルの分散の算出ではVAR.SとVAR.Pのどっちを使うべきか【関数まとめ】

はじめに
統計量の「分散」には
- 母分散
- 標本分散
- 不偏分散
の複数が存在します。
一方で、エクセルにも VAR.P
関数と VAR.S
関数の2つがあります。
関連する関数 (VARP
, VARPA
, VAR
, VARA
) との関係性も整理しました。
分散とエクセルでの計算方法の一覧表
分散(母分散、 標本分散、 不偏分散)と、それぞれ算出するためのエクセル関数の対応関係を以下の表に示しました。
統計量 | 使用するデータ (入力) | 統計量の意味(出力) | 計算式 | エクセル関数 |
---|---|---|---|---|
母分散 | 母集団の全データ | 母集団の全データ のバラツキ | VAR.P | |
標本分散 | 標本データ (母集団の一部) | 標本データ のバラツキ | VAR.P | |
不偏分散 | 標本データ (母集団の一部) | 母集団の全データ のバラツキ (推定量) | VAR.S |
VAR.P
と VAR.S
のどっちを使うかは、
- 使用するデータ そのもの のバラツキを算出するとき
(出力 = 入力データのバラツキ)VAR.P
関数 - 使用するデータの 背景にある母集団 のバラツキ (推定量) を算出 するとき
(出力 ≠ 入力データのバラツキ)VAR.S
関数
で判断できると言えるでしょう。
サンプル数が多い場合はどちらでもほぼ差がない
サンプル数 () が大きくなると、
VAR.P
関数とVAR.S
関数の差はほぼなくなります
( のとき、 となるため)。
そのため、サンプル数 () が多い場合は、どちらを使っても問題になることは少ないでしょう。
「標本分散 = 不偏分散」とされる場合も
「標本分散」の扱いは、人によって異なる場合があります。
「標本分散 = 不偏分散」とされることもあるようなので注意が必要です。
計算式の分母が と の、どちらなのかに着目しましょう。
関連するエクセル関数
VAR.P
関数と VAR.S
関数に関連する関数について、以下にまとめました。
(※ ここでは VAR.P
関数と VAR.S
関数を基本関数と呼んでいます)
統計量 | 基本関数 | 基本関数(旧) | A付き関数 |
---|---|---|---|
母分散・標本分散 | VAR.P | VARP | VARPA |
不偏分散 | VAR.S | VAR | VARA |
基本関数(旧)
VARP
関数と VAR
関数は、古いバージョンのエクセルから残っている関数です。 VAR.P
関数や VAR.S
関数が使えないバージョンでない限りは、
A付き関数
末尾に A
が付いている VARPA
関数や VARA
関数は、
入力データ型 | 基本関数VAR.P , VAR.S | A付き関数VARPA , VARA |
---|---|---|
数値 | 数値として扱う | 数値として扱う |
文字列 | 無視 | 0として扱う |
論理値 TRUE | 無視 | 1 として扱う |
論理値 FALSE | 無視 | 0 として扱う |
エクセルのセルデータサンプル
以下の 全セルをコピー
ボタンをクリックし、エクセルのセルに貼り付けられます。
A | B | C | D | E | F | G | |
1 | データ | ||||||
2 | X | 母分散 / 標本分散 | |||||
3 | 11 | 基本関数 | =VAR.P(A3:A8) | =2 | |||
4 | 12 | A付き関数 | =VARPA(A3:A8) | =25.1388888888889 | |||
5 | - | ||||||
6 | 13 | 不偏分散 | |||||
7 | 14 | 基本関数 | =VAR.S(A3:A8) | =2.5 | |||
8 | 15 | A付き関数 | =VARA(A3:A8) | =30.1666666666667 | |||
9 | |||||||
10 |