はじめに
エクセルには、アドオンの「データ分析」ツールの中に分散共分散行列(共分散行列)を算出できる機能があります。
下にサンプルのセルデータがあるので、
分散共分散行列とは
分散共分散行列は、データセット内の変数の分散と、変数間の共分散を行列形式で表したもの です。
行列の成分は
- 対角成分: データセット内の変数の分散
- 非対角成分: データセット内の変数間の共分散
を表します。
いつ使うのか?
多次元データの分布や全体的な構造を把握するのに役立ちます。
- データの各変数のバラツキ
- データの変数同士がどの程度一緒に変動するか
定義式
変数が のデータセットがあるとき、
- : 変数 の分散
- : 変数 と の共分散
エクセルでの算出方法
以下の 全セルをコピー ボタンをクリックし、エクセルの A1 セルに貼り付けると、
データを変更したい場合は、
このサンプルでは、以下の結果が得られます。
算出手順
エクセルで分散共分散行列を算出するための手順は以下の3つです。
1. 参照データ(変数)番号を記入
0 始まりで、データの変数分の連番を記入します。
以下のように、2か所に記入する必要があります。
- 手順1a. 1列に連番を記入
- 手順1b. 1行に連番を記入
2. 行列要素を算出
OFFSET, COVARIANCE.S 関数を使用して、行列要素を算出します。
参照, 行数, 列数, 高さ, 幅)参照を基準に、 参照位置を移動したデータを返す。
参照位置は、縦方向に行数分、横方向に列数分だけ移動する。
高さと幅を指定すると、取得するデータサイズが変わる。
スピル機能(またはCSE)使用。
参照行数参照基準)。列数参照基準)。高さ幅配列1, 配列2)配列1と配列2のデータ列間の 不偏共分散を算出する。
配列1と配列2が等しいデータ列の場合、
分散値が算出される。
配列1配列2