小梅の日記帳

覚書き、メモ、等々残していくつもりです。

t分布について

2標本の差の検定について纏めておきたいと思います。
2つの標本 X_{1}, X_{2} \cdots X_{n} Y_{1}, Y_{2}, \cdots Y_{m}について、 それぞれの標本の平均を \overline{X}, \overline{Y}とします。

 t分布の定義

 t分布の定義は以下の通りで、標準正規分布 {\chi}^2分布の商で表されてます。


\displaystyle \frac{Z}{\sqrt{\frac{W}{n}}}{\sim}t_{n}

Z{\sim}N(0, 1)\\
W{\sim}{\chi}^2_{n}

 {\chi}^2分布の自由度のところで証明した様に、平均値と偏差平方和は独立になります。
 Zには平均値が入り、 Wには偏差平方和が入るので、 Z, Wは独立ということになります。

分子の Zについて

まず、 Zに入れる値について考えます。

 X, Yの母平均を \mu_{1}, \mu_{2}、母分散を共通として {\sigma}^2とする。


 {\chi}^2分布の自由度は母平均 \muか、標本平均 \overline{X}かで変わる。

 X{\sim}N({\mu, {\sigma}^2})の時、


\begin{aligned}
\displaystyle
&\left( \frac{X_{1}-\mu}{\sigma}\right)^2 +
\left( \frac{X_{2}-\mu}{\sigma} \right)^2 +
\cdots +
\left( \frac{X_{n}-\mu}{\sigma} \right)^2
{\sim} {\chi}^2_{n}\\

\displaystyle
&\left( \frac{X_{1}-\overline{X}}{\sigma}\right)^2 +
\left( \frac{X_{2}-\overline{X}}{\sigma} \right)^2 +
\cdots +
\left( \frac{X_{n}-\overline{X}}{\sigma} \right)^2
{\sim} {\chi}^2_{n-1}
\end{aligned}


また、平均 \overline{X}と偏差 {( X_{i}-\overline{X} )}^2は独立となる。



 {\chi}^2分布の再生性(reproduction)
自由度aの {\chi}^2_{a}と、自由度bの {\chi}^2_{b}の和は自由度a+bの {\chi}^2_{a+b}に従う。

2つの母集団から、

 
\displaystyle
S^2 = 
\frac{\sum_{i=1}^{n}\left(X_{i} - \overline{X}\right)^2 + \sum_{i=1}^{m}\left(Y_{i} - \overline{Y}\right)^2}{m+n-2}

ここで、
 \overline{X} S^2は独立
 \overline{Y} S^2は独立



ここで、2つの母集団の母分散が等しい(等分散)であると仮定する。

 
\displaystyle
X{\sim}N({\mu}_{1}, {\sigma}^2)\\
Y{\sim}N({\mu}_{2}, {\sigma}^2)


上式の両辺を {\sigma}^2で割って整理すると、下式が得られる。

 
\displaystyle
\frac{(m+n-2)S^2}{{\sigma}^2} = \sum_{i=1}^{n}\left(\frac{X_{i} - \overline{X}}{\sigma}\right)^2 + \sum_{i=1}^{m}\left(\frac{Y_{i} - \overline{Y}}{\sigma}\right)^2

右辺は自由度m+n-2の {\chi}^2分布に従う。

 
\displaystyle
\sum_{i=1}^{n}\left(\frac{X_{i} - \overline{X}}{\sigma}\right)^2 + \sum_{i=1}^{m}\left(\frac{Y_{i} - \overline{Y}}{\sigma}\right)^2 {\sim} {\chi}^2_{m+n-2}



次に、 \overline{X}-\overline{Y}の母平均と母分散について考える。


\begin{aligned}
E[ \overline{X}-\overline{Y} ] &= E[ \overline{X} ]-E[ \overline{Y}]\\
&= {\mu}_{1} - {\mu}_{2}
\end{aligned}

\begin{aligned}
V[ \overline{X}-\overline{Y} ] &= V[ \overline{X} ]-V[ \overline{Y} ]\\
&= \frac{{\sigma}^2}{n}+\frac{{\sigma}^2}{m}
\end{aligned}

\displaystyle
\frac{\overline{X}-\overline{Y}-({\mu_{1}}-{\mu}_{2})}{\sqrt{\left(\frac{1}{m}+\frac{1}{n}\right){\sigma}^2}}{\sim}N(0, 1)

最後に、t分布の式へ代入します。