エクセル関数を使ったマンホイットニーのU検定のやり方【コピペ用テンプレートあり】|インタラクティブに数理学

エクセルでの算出方法

以下の全セルをコピーボタンをクリックし、エクセルの A1 セルに貼り付けると、 K16 セルにp値（下記の場合 0.031449255）、 K19セルに検定結果（下記の場合（有意差）あり）が出力されます。

データを書き換える場合は、 A, B列のデータを書き換え、 J3, J4セルのグループ名も更新してください。またデータ数に応じて、D ~ G列のセル中の計算式を下に拡張（コピー）、または削除してください。

計算値を表示

	A	B	C	D	E	F	G	H	I	J	K	L	M
1	データ
2	グループ	値		順位	同値判定	k	k^3-k				順位和	n	U
3	X	99		53	1	1	0			X	1014	31	257
4	Y	137		35	1	1	0			Y	582	25	518
5	X	108		51	1	1	0
6	X	111		47	1	1	0
7	Y	124		42	1	1	0			N	56
8	Y	134		38	1	1	0			T	78
9	X	116		43	1	1	0
10	X	133		39	1	1	0			U	257
11	Y	150		26	1	3	24			μ_u	387.5
12	X	103		52	1	1	0			σ_u^2	3679.614
13	Y	135		36.5	1	2	6			z_u	2.151
14	X	139		33.5	1	2	6
15	Y	90		54	1	1	0			有意水準α	0.05
16	Y	112		45.5	1	2	6			p値	0.031
17	X	146		30	1	1	0
18	X	150		26	0	0	0			結果
19	X	155		20.5	1	2	6			有意差	あり
20	X	141		32	1	1	0
21	X	139		33.5	0	0	0
22	X	196		1	1	1	0
23	X	155		20.5	0	0	0
24	X	159		19	1	1	0
25	X	161		17	1	1	0
26	X	164		14.5	1	2	6
27	X	144		31	1	1	0
28	X	150		26	0	0	0
29	X	132		40	1	1	0
30	Y	164		14.5	0	0	0
31	Y	172		10	1	1	0
32	Y	154		22.5	1	2	6
33	Y	154		22.5	0	0	0
34	X	130		41	1	1	0
35	Y	151		24	1	1	0
36	X	147		29	1	1	0
37	Y	160		18	1	1	0
38	Y	162		16	1	1	0
39	Y	178		9	1	1	0
40	Y	179		8	1	1	0
41	Y	182		5.5	1	2	6
42	Y	182		5.5	0	0	0
43	X	112		45.5	0	0	0
44	Y	169		11	1	1	0
45	Y	187		4	1	1	0
46	Y	149		28	1	1	0
47	Y	109		49.5	1	2	6
48	X	79		55	1	1	0
49	X	109		49.5	0	0	0
50	X	188		3	1	1	0
51	X	64		56	1	1	0
52	X	168		12.5	1	2	6
53	X	168		12.5	0	0	0
54	X	115		44	1	1	0
55	Y	180		7	1	1	0
56	X	135		36.5	0	0	0
57	Y	191		2	1	1	0
58	Y	110		48	1	1	0

算出手順

エクセルでマンホイットニーのU検定（正規近似）を行うための手順は、以下の6つです。

1. データ値の順位を算出

同値の場合は平均値をとります。

2. 重複の補正項の計算

データ中に重複がある場合、検定統計量 $Z_U$ を算出する値に補正項 $T$ を入れる必要があります。

補正項 : T = \sum_{i=1} k_i^3 - k_i

そのために必要な $k^2-k$ の計算を、E ~ G列で以下のように行います。

同値判定 (E列)：重複している場合は、2回目以降の重複値で0を、それ以外は1を返す（ROW(), MATCH関数使用）。
$k$ の算出 (F列)：重複数をカウント（同値判定 = 1 の行のみ）。
$k^2-k$ の算出 (G列)： $k$ を使って計算。

f_xROW関数

	A	B	C	D
1	参照セル		行番号
2	-	→	2	(呼び出し元のC2セルが参照される)
3
4	A4	→	4
5	A5	→	5

ROW ( 参照)

指定した参照セルの 行番号を返す。 未指定の場合、呼び出し元のセルが指定される。

•

参照

: 任意

例A4

行番号を取得するセル。

f_xMATCH関数

	A	B	C	D	E	F
1	A
2	B			検索値：	C
3	C			検索結果：	3
4	D
5	E

MATCH ( 検査値, 検査範囲, 照合の種類)

指定した検査範囲の中を検索し、最初に検査値に マッチしたセルの相対位置を返す。

•

検査値

: 必須

例"C"

検索する値（文字列や数値）。

•

検査範囲

: 必須

例A1:A5

検索範囲。

•

照合の種類

: 任意

例0

照合の型を設定する数値（0：完全一致でマッチ、1：検査値以下の最大値にマッチ、-1：検査値以上の最小値にマッチ）。

3. グループ別に順位和, $n$ , $U$ を算出

2グループそれぞれ、個別の順位和とデータサイズ $n$ 、 $U$ 値を算出します。

a. 順位和

SUMIFS関数を使い、各グループごとに順位和（順位の合計値）を算出します。

f_xSUMIFS関数

	A	B	C	D	E	F	G	H	I
1	A		1
2	A	OK	1			条件1：	A	でない
3	B	OK	1			条件2：	OK	がある
4	B		1
5	B	OK	1			合計値：	2

SUMIFS ( 合計対象範囲, 検索範囲1, 検索条件1, 検索範囲2, 検索条件2, ... )

複数の条件を設定し、 合計対象範囲 の値を合計 する。
指定した 検索範囲1 内で、検索条件1 に合致した位置と同じ位置の、 合計対象範囲 の値が合計される。検索範囲と条件をセットで追加（例：検索範囲2と検索条件2）することで、複数条件を設定できる（最大127セット）。

•

合計対象範囲

: 必須

例C1:C5

合計する数値データ範囲。

•

検索範囲1

: 必須

例A1:A5

検索条件1で検索するデータ範囲。

•

検索条件1

: 必須

例"<>" & G2

合計する条件。

•

検索範囲2

: 任意

例B1:B5

検索条件2で検索するデータ範囲。

•

検索条件2

: 任意

例"<>" & G3

合計する条件。

b. データサイズ $n$

COUNTIFS関数を使い、各グループごとにデータサイズを算出します。

f_xCOUNTIFS関数

	A	B	C	D	E	F	G	H
1	1	A
2	2	A			条件1	3	以上
3	3	B			条件2	C	でない
4	4	B
5	5	C			カウント列数	2	個

COUNTIFS ( 配列1, 検索条件1, 配列2, 検索条件2, ... )

指定した 配列1 データ中で、 検索条件1 に合致する個数をカウント する。
配列とその条件のセット（例：配列2と検索条件2）を追加することで、複数条件を追加設定できる（最大127セット）。

•

配列1

: 必須

例A1:A5

検索条件1で検索するデータ範囲。

•

検索条件1

: 必須

例">=" & E2

カウントする条件1。

•

配列2

: 任意

例A1:A5

検索条件2で検索するデータ範囲。

•

検索条件2

: 任意

例">=" & E2

カウントする条件2。

c. $U$ 値

上記の a., b.の結果を使って、各グループごとに $U$ 値を算出します。データ中の2グループがX, Yのとき、グループ $X$ の $U$ 値は、以下の通りです。

U_X = n_Xn_Y + \frac{n_X(n_X+1)}{2} - H_X

$n_X$ : グループ $X$ のデータサイズ
$n_Y$ : グループ $Y$ のデータサイズ
$H_X$ : グループ $X$ の順位和

4. 検定統計量 $Z_U$ の算出

手順2, 3で算出した値を使って、検定統計量 $Z_U$ を算出します。

Z_U = \frac{|U - \mu_U |}{\sqrt{\sigma_U^2}} \\

$U = {\rm min}(U_X, U_Y)$
$\mu_U = n_Xn_Y/2$
$\sigma_U^2 = n_Xn_Y/12 \times (N+1-\frac{T}{N(N+1)})$
$N = n_X + n_Y$

5. α設定、p値の算出

事前に、有意水準αを設定します。 0.05（5%）や 0.01（1%）が一般的です。

次に、検定統計量 $Z_U$ から、NORM.S.DIST関数を使ってp値を算出します。

f_xNORM.S.DIST関数

	A	B	C
1	z：	1.96
2		↓
3	z以下の累積確率：	0.975
4	zにおける確率密度：	0.058

NORM.S.DIST ( z, 関数形式)

指定したz値に対する標準正規分布（平均0、標準偏差1）の「累積確率」または「確率密度」を計算する（関数形式によって切り替え）。
（旧関数：NORMSDIST関数）

•

z

: 必須

例1.96

F値（正の数値）。

•

関数形式

: 必須

例TRUE

累積確率を返すかを指定（TRUE：累積確率を返す、FALSE：確率密度を返す）。

6. 結果の表示

手順5で設定した有意水準と、算出したp値を比較し、検定結果を表示します。

はじめに

マンホイットニーのu検定とは

いつ使うのか？

算出値の意味

エクセルでの算出方法