2025/4/24

エクセルの分散の算出ではVAR.SとVAR.Pのどっちを使うべきか【関数まとめ】

Thumbnail for エクセルの分散の算出ではVAR.SとVAR.Pのどっちを使うべきか【関数まとめ】

はじめに

統計量の「分散」には

  • 母分散
  • 標本分散
  • 不偏分散

の複数が存在します。

一方で、エクセルにも VAR.P 関数と VAR.S 関数の2つがあります。 これらの対応関係について、混乱しがちなので整理しました。

関連する関数 (VARP, VARPA, VAR , VARA) との関係性も整理しました。

分散とエクセルでの計算方法の一覧表

分散(母分散、 標本分散、 不偏分散)と、それぞれ算出するためのエクセル関数の対応関係を以下の表に示しました。

統計量使用するデータ (入力)統計量の意味(出力)計算式エクセル関数
母分散母集団の全データ母集団の全データ のバラツキ1N(xiμ)2\frac{1}{N}\sum(x_i-\mu)^2VAR.P
標本分散標本データ
(母集団の一部)
標本データ のバラツキ1n(xixˉ)2\frac{1}{n}\sum(x_i-\bar{x})^2VAR.P
不偏分散標本データ
(母集団の一部)
母集団の全データ のバラツキ
(推定量)
1n1(xixˉ)2\frac{1}{n-1}\sum(x_i-\bar{x})^2VAR.S

VAR.PVAR.S のどっちを使うかは、

  • 使用するデータ そのもの のバラツキを算出するとき
    (出力 = 入力データのバラツキ) VAR.P 関数
  • 使用するデータの 背景にある母集団 のバラツキ (推定量) を算出 するとき
    (出力 ≠ 入力データのバラツキ) VAR.S 関数

で判断できると言えるでしょう。

サンプル数が多い場合はどちらでもほぼ差がない

サンプル数 nn (NN) が大きくなると、VAR.P 関数と VAR.S 関数の差はほぼなくなります
n n \to \infty のとき、1n11n\frac{1}{n-1} \to \frac{1}{n} となるため)。
そのため、サンプル数 nn (NN) が多い場合は、どちらを使っても問題になることは少ないでしょう。

「標本分散 = 不偏分散」とされる場合も

「標本分散」の扱いは、人によって異なる場合があります。
「標本分散 = 不偏分散」とされることもあるようなので注意が必要です。
計算式の分母が nnn1n-1 の、どちらなのかに着目しましょう。

関連するエクセル関数

VAR.P 関数と VAR.S 関数に関連する関数について、以下にまとめました。
(※ ここでは VAR.P 関数と VAR.S 関数を基本関数と呼んでいます)

統計量基本関数基本関数(旧)A付き関数
母分散・標本分散VAR.PVARPVARPA
不偏分散VAR.SVARVARA

基本関数(旧)

VARP 関数と VAR 関数は、古いバージョンのエクセルから残っている関数です。 エクセルが、VAR.P 関数や VAR.S 関数が使えないバージョンでない限りは、 これらを使用する理由はあまりありません。

A付き関数

末尾に A が付いている VARPA 関数や VARA 関数は、 文字列や論理値(TRUE / FALSE)の扱いが変わります。

入力データ型基本関数
VAR.P, VAR.S
A付き関数
VARPA, VARA
数値数値として扱う数値として扱う
文字列無視0として扱う
論理値 TRUE無視1 として扱う
論理値 FALSE無視0 として扱う

エクセルのセルデータサンプル

以下の 全セルをコピー ボタンをクリックし、エクセルのセルに貼り付けられます。

ABCDEFG
1データ
2X母分散 / 標本分散
311基本関数=VAR.P(A3:A8)=2
412A付き関数=VARPA(A3:A8)=25.1388888888889
5-
613不偏分散
714基本関数=VAR.S(A3:A8)=2.5
815A付き関数=VARA(A3:A8)=30.1666666666667
9
10