理系学生日記

おまえはいつまで学生気分なのか

t分布の確率密度関数を導出する

統計学では、$t$分布と呼ばれる分布もよく現れます。

この$t$分布は、独立な2つの確率変数$Z \sim N(0,1)$、$W \sim \chi ^{2} (m)$の従うときに、次の$t$が従う分布とされます。

$$ t = \frac{Z}{\sqrt{\frac{W}{m}}} $$

この$t$分布の確率密度関数は次のような複雑な式となるわけですが、今日はこれを導出しましょう。

$$ f(t) = \frac{\Gamma \left( \frac{m+1}{2} \right)}{\sqrt{\pi m} \Gamma \left( \frac{m}{2} \right)} \left( 1 + \frac{t ^{2}}{m}\right) ^{- \frac{m+1}{2}} = \frac{1}{\sqrt{m} B\left( \frac{m}{2}, \frac{1}{2}\right)} \left( 1 + \frac{t ^{2}}{m}\right) ^{- \frac{m+1}{2}} $$

$Z$と$W$の同時確率密度関数

まず$Z$と$W$はそれぞれが標準正規分布、自由度$m$の$\chi ^{2}$分布に従う前提から、その確率密度関数は次のように表せます。

$$ \begin{align} f(z) &= \frac{1}{\sqrt{2\pi}} e ^{-\frac{z ^{2}}{2}} \newline g(w) &= \frac{1}{2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} w ^{\frac{m}{2} - 1}e ^{-\frac{w}{2}} \end{align} $$

さらに、$Z$と$W$は独立であるという前提から、二変数の同時確率密度関数$h _{m}(z,w)$はその積となります。

$$ \begin{align} h _{m} (z,w) &= f(z) g(w) \newline &= \left(\frac{1}{\sqrt{2\pi}} e ^{-\frac{z ^{2}}{2}} \right)\left( \frac{1}{2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} w ^{\frac{m}{2} - 1}e ^{-\frac{w}{2}} \right) \end{align} $$

$Z$と$W$の累積分布関数

ここで、$T = \frac{Z}{\sqrt{\frac{W}{m}}}$とおき、$t$の累積分布関数$H(t) = P(T < t)$を求めてみます。

$$ \begin{align} H(t) &= P(T < t) \newline &= P(\frac{Z}{\sqrt{\frac{W}{m}}} < t) \newline &= \iint _{\frac{Z}{\sqrt{\frac{W}{m}}} < t} \left(\frac{1}{\sqrt{2\pi}} e ^{-\frac{z ^{2}}{2}} \right)\left( \frac{1}{2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} w ^{\frac{m}{2} - 1}e ^{-\frac{w}{2}} \right) dwdz \end{align} $$

ここで次のような変数変換を考えます。

$$ \begin{cases} x = \frac{Z}{\sqrt{\frac{W}{m}}} \newline y = w \end{cases} \Leftrightarrow \begin{cases} z = x \sqrt{\frac{y}{m}} \newline w = y \end{cases} $$

こうすると、この変数変換に関するヤコビアン$J$は、次のようになります。

$$ \begin{align} J &= \det \begin{bmatrix} \frac{\partial z}{\partial x} & \frac{\partial z}{\partial y} \newline \frac{\partial w}{\partial x} & \frac{\partial w}{\partial y} \end{bmatrix} \newline &= \det \begin{bmatrix} \sqrt{\frac{y}{m}} & \frac{\partial z}{\partial y} \newline 0 & 1 \end{bmatrix} \newline &= \sqrt{\frac{y}{m}} \end{align} $$

積分区間については$\frac{Z}{\sqrt{\frac{W}{m}}} < t \Leftrightarrow x < t$です。また、$W=Y$は$\chi ^{2}$分布に従うため、その積分区間は$0$から$\infty$までになります。 これらの情報を元に置換積分を行います。

$$ \begin{align} H(t) &= \iint _{x < t} \left( \frac{1}{\sqrt{{2\pi}}} e ^{-\frac{1}{2}\left(x ^{2} \frac{y}{m} \right)}\right)\left( \frac{1}{2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} y ^{\frac{m}{2} - 1}e ^{-\frac{y}{2}} \right) \sqrt{\frac{y}{m}} dydx \newline &= \iint _{x < t} \frac{1}{\sqrt{2\pi} }\frac{1}{2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} \frac{1}{\sqrt{m}} y ^{\frac{m}{2}-1+\frac{1}{2}} e ^{-\frac{x ^{2}y}{2m} - \frac{y}{2}} dydz \newline &= \frac{1}{\sqrt{2\pi m} \cdot 2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} \iint _{x < t} y ^{\frac{m-1}{2}} e ^{-\frac{y}{2} \left( 1 + \frac{x ^{2}}{2}\right)} dydz \end{align} $$

ガンマ関数に寄せていく

積分部はガンマ関数に似ているので、これがガンマ関数になるように次のように変数変換します。

$$ \begin{cases} u = \frac{y}{2}\left( 1 + \frac{x ^{2}}{m} \right) \newline v = x \end{cases} \Leftrightarrow \begin{cases} y = \frac{2u}{1 + \frac{v ^{2}}{m}} \newline x = v \end{cases} $$

そうすると、このヤコビアンはどうなるかというと、次のようになります。

$$ \begin{align} J &= \det \begin{bmatrix} \frac{\partial y}{\partial u} & \frac{\partial y}{\partial v} \newline \frac{\partial x}{\partial u} & \frac{\partial x}{\partial v} \end{bmatrix} \newline &= \det \begin{bmatrix} \frac{2}{1+\frac{v ^{2}}{m}} & 1 \newline 0 & 1 \end{bmatrix} \newline &= \frac{2}{1+\frac{v ^{2}}{m}} \end{align} $$

従って、この変数変換後の累積分布関数の形は次のようになります。

$$ \begin{align} H(t) &= \frac{1}{\sqrt{2\pi m} \cdot 2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} \int _{-\infty} ^{t} \int _{0} ^{\infty} e ^{-u} \left( \frac{2u}{1 + \frac{v ^{2}}{m}} \right) ^{\frac{m-1}{2}}\left( \frac{2}{1 + \frac{v ^{2}}{m}} \right) dudv \newline &= \frac{1}{\sqrt{2\pi m} \cdot 2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} \int _{-\infty} ^{t} \int _{0} ^{\infty} e ^{-u} \left( \frac{2}{1 + \frac{v ^{2}}{m}} \right) ^{\frac{m+1}{2}} u ^{\frac{m-1}{2}} dudv \newline &= \frac{2 ^{ \frac{m+1}{2}}}{\sqrt{2\pi m} \cdot 2 ^{\frac{m}{2}}\Gamma \left( \frac{m}{2} \right)} \int _{0} ^{\infty} e ^{-u} u ^{\frac{m+1}{2} - 1} du \int _{- \infty} ^{t} \left( \frac{1}{1 + \frac{v ^{2}}{m}} \right) ^{\frac{m+1}{2}} dv \newline &= \frac{\sqrt{2} \Gamma \left( \frac{m+1}{2} \right) }{\sqrt{2\pi m} \cdot \Gamma \left( \frac{m}{2} \right)} \int _{- \infty} ^{t} \left( 1 + \frac{v ^{2}}{m} \right) ^{-\frac{m+1}{2}} dv \newline &= \frac{\Gamma \left( \frac{m+1}{2} \right) }{\sqrt{\pi m} \cdot \Gamma \left( \frac{m}{2} \right)} \int _{- \infty} ^{t} \left( 1 + \frac{v ^{2}}{m} \right) ^{- \frac{m+1}{2}} dv \end{align} $$

$t$分布の確率密度関数

$t$分布の確率密度関数は、上記式を$t$で微分することによって求められます。

$$ \begin{align} h(t) &= \frac{dH(t)}{dt} \newline &= \frac{1}{\sqrt{\pi m} \cdot \Gamma \left( \frac{m}{2} \right)} \Gamma \left( \frac{m+1}{2} \right) \left( 1 + \frac{t ^{2}}{m} \right) ^{- \frac{m+1}{2}} \end{align} $$

$\sqrt{\pi} = \Gamma \left(\frac{1}{2} \right)$であること、および、$B(p,q) = \frac{\Gamma (p) \Gamma (q)}{\Gamma (p+q)}$の関係があることを考慮すると、ベータ関数を用いて次のようにも示せます。

$$ \begin{align} h(t) &= \frac{\Gamma \left( \frac{m+1}{2} \right)}{\sqrt{\pi m} \cdot \Gamma \left( \frac{m}{2} \right)} \left( 1 + \frac{t ^{2}}{m} \right) ^{- \frac{m+1}{2}} \newline &= \frac{\Gamma \left( \frac{m+1}{2} \right)}{\sqrt{m} \Gamma \left( \frac{1}{2} \right) \Gamma \left( \frac{m}{2} \right)}\left( 1 + \frac{t ^{2}}{m} \right) ^{- \frac{m+1}{2}} \newline &= \frac{1}{\sqrt{m} B\left( \frac{1}{2}, \frac{1}{m}\right)}\left( 1 + \frac{t ^{2}}{m} \right) ^{- \frac{m+1}{2}} \end{align} $$