理系学生日記

おまえはいつまで学生気分なのか

自由度$(m _{1}, m _{2})$であるF分布の確率密度関数を導出する

独立に$\chi ^{2} (m _{1}), \chi ^{2} (m _{2})$に従う2つの確率変数 $W _{1}, W _{2}$があるとき、それぞれをその自由度で割って比をとった $$ F = \frac{\frac{ W _{1}}{ m _{1}}}{ \frac{W _{2}}{ m _{2}}} $$ が従う分布を、自由度$(m _{1}, m _{2})$のF分布と呼び、$F( m _{1}, m _{2})$と表します。

この確率密度関数は次の式になるのですが、今日はこのF分布の確率密度関数を導出します。正直覚える気にならない式の形ですね。

$$ f _{X} (x) = \frac{1}{B \left( \frac{ m _{1} } {2}, \frac{ m _{2}}{2} \right)} \left( \frac{ m _{1} }{ m _{2}} \right) ^{\frac{ m _{1}}{2}} \frac{ x ^{\frac{m _{1}}{2}-1}}{\left( 1 + \frac{m _{1}}{m _{2}}x\right) ^{\frac{ m _{1} + m _{2}}{2}}} $$

導出

導出の考え方は$t$分布のときと大きく変わりません。

同時確率密度関数を求める

まず、$W _{1} \sim \chi ^{2} ( m _{1} ), W _{2} \sim \chi ^{2} ( m _{2} )$から、それぞれの確率密度関数は次の式で表せます。

$$ \begin{align} f( w _{1}) &= \frac{1}{2 ^{\frac{m _{1}}{2}} \Gamma \left( \frac{m _{1}}{2} \right)} w _{1} ^{\frac{ m _{1}}{2}-1} e ^{-\frac{ w _{1}}{2}} \newline g( w _{2}) &= \frac{1}{2 ^{\frac{m _{2}}{2}} \Gamma \left( \frac{m _{2}}{2} \right)} w _{2} ^{\frac{ m _{2}}{2}-1} e ^{-\frac{ w _{2}}{2}} \end{align} $$

$W _{1}, W _{2}$は互いに独立なので、それらの同時確率密度関数 $f _{ W _{1}, W _{2}}( w _{1}, w _{2})$は次のようになります。

$$ \begin{align} f _{ W _{1}, W _{2}}( w _{1}, w _{2}) &= f (w _{1}) g (w _{2}) \newline &= \left( \frac{1}{2 ^{\frac{m _{1}}{2}} \Gamma \left( \frac{m _{1}}{2} \right)} w _{1} ^{\frac{ m _{1}}{2}-1} e ^{-\frac{ w _{1}}{2}} \right)\left( \frac{1}{2 ^{\frac{m _{2}}{2}} \Gamma \left( \frac{m _{2}}{2} \right)} w _{2} ^{\frac{ m _{2}}{2}-1} e ^{-\frac{ w _{2}}{2}} \right) \newline &= \frac{1}{2 ^{\frac{m _{1} + m _{2}}{2}} \Gamma \left( \frac{m _{1}}{2} \right) \Gamma \left( \frac{m _{2}}{2} \right)} w _{1} ^{\frac{ m _{1}}{2}-1} w _{2} ^{\frac{ m _{2}}{2}-1} e ^{-\frac{w _{1} + w _{2}}{2}} \end{align} $$

変数変換した同時確率密度関数

ここで、次のように変数変換します。

$$ \begin{cases} x &= \frac{\frac{ w _{1}}{ m _{1}}}{ \frac{w _{2}}{ m _{2}}} \newline y &= w _{2} \end{cases} \Leftrightarrow \begin{cases} w _{1} &= \frac{m _{1}}{m _{2}} yx \newline w _{2} &= y \end{cases} $$

この変数変換のヤコビアン$J$を求めます。

$$ \begin{align} J &= \det \begin{bmatrix} \frac{\partial w _{1}}{\partial x} & \frac{\partial w _{1}}{\partial y} \newline \frac{\partial w _{2}}{\partial x} & \frac{\partial w _{2}}{\partial y} \end{bmatrix} \newline &= \det \begin{bmatrix} \frac{m _{1}}{m _{2}}y & \frac{m _{1}}{m _{2}}x \newline 0 & 1 \end{bmatrix} \newline &= \frac{m _{2}}{ m _{1}}y \end{align} $$

従って、この確率変数$X, Y$の同時確率密度関数は次のようになるでしょう。

$$ \begin{align} f _{X, Y} (x, y) &= \frac{1}{2 ^{\frac{m _{1} + m _{2}}{2}} \Gamma \left( \frac{m _{1}}{2} \right) \Gamma \left( \frac{m _{2}}{2} \right)} \left( \frac{m _{1}}{m _{2}} yx \right) ^{\frac{ m _{1}}{2}-1} y ^{\frac{ m _{2}}{2}-1} e ^{-\frac{\left( \frac{m _{1}}{m _{2}} yx \right) + y}{2}} \left( \frac{m _{2}}{ m _{1}}y \right) \newline &= \frac{1}{2 ^{\frac{m _{1} + m _{2}}{2}} \Gamma \left( \frac{m _{1}}{2} \right) \Gamma \left( \frac{m _{2}}{2} \right)} \left( \frac{m _{1}}{m _{2}} \right) ^{\frac{ m _{1}}{2}} x ^{\frac{ m _{1}}{2} -1} y ^{\frac{ m _{1} + m _{2}}{2} -1} e ^{-\frac{y}{2} \left( \frac{m _{1}}{m _{2}}x+1\right)} \end{align} $$

周辺確率密度関数を求める形で確率密度関数を求める

$X$の確率密度関数$f _{X}(x)$を求めます。これが求めるべき$F$分布の確率密度関数ですね。

$$ \begin{align} f _{X}(x) &= \int _{0} ^{\infty} f _{X, Y} (x,y) dy \newline &= \frac{1}{2 ^{\frac{m _{1} + m _{2}}{2}} \Gamma \left( \frac{m _{1}}{2} \right) \Gamma \left( \frac{m _{2}}{2} \right)} \left( \frac{m _{1}}{m _{2}} \right) ^{\frac{ m _{1}}{2}} x ^{\frac{ m _{1}}{2} -1} \int _{0} ^{\infty} y ^{\frac{ m _{1} + m _{2}}{2} -1} e ^{-\frac{y}{2} \left( \frac{m _{1}}{m _{2}}x+1\right)} dy \end{align} $$

すでに後半の積分箇所がガンマ関数と近しい形になっています。このため、この積分部分を$I$とおき、をガンマ関数にするように変形していきましょう。

$$ \begin{align} I \equiv \int _{0} ^{\infty} y ^{\frac{ m _{1} + m _{2}}{2} -1} e ^{-\frac{y}{2} \left( \frac{m _{1}}{m _{2}}x+1\right)} dy \end{align} $$

$t = \frac{y}{2} \left( \frac{m _{1}}{m _{2}}x+1\right)$とおきます。そうすると、$y = \frac{2 m _{2}}{m _{1}x + m _{2}}t$であり、$dy = \frac{2 m _{2}}{m _{1}x + m _{2}}dt$です。積分区間は変わらないですね。

$$ \begin{align} \therefore I &= \int _{0} ^{\infty} \left( \frac{2 m _{2}}{m _{1}x + m _{2}}t \right) ^{\frac{ m _{1} + m _{2}}{2} -1} e ^{-t} \left( \frac{2 m _{2}}{m _{1}x + m _{2}}dt \right) \newline &= \left( \frac{2 m _{2}}{m _{1}x + m _{2}} \right) ^{\frac{ m _{1} + m _{2}}{2}} \int _{0} ^{\infty} t ^{\frac{ m _{1} + m _{2}}{2} -1} e ^{-t} dt \newline &=\left( \frac{2 m _{2}}{m _{1}x + m _{2}} \right) ^{\frac{ m _{1} + m _{2}}{2}} \Gamma \left( \frac{ m _{1} + m _{2}}{2}\right) \end{align} $$

これで求めるべき確率密度関数が求められます。

$$ \begin{align} \therefore f _{X}(x) &= \frac{1}{2 ^{\frac{m _{1} + m _{2}}{2}} \Gamma \left( \frac{m _{1}}{2} \right) \Gamma \left( \frac{m _{2}}{2} \right)} \left( \frac{m _{1}}{m _{2}} \right) ^{\frac{ m _{1}}{2}} x ^{\frac{ m _{1}}{2} -1} \cdot \left( \frac{2 m _{2}}{m _{1}x + m _{2}} \right) ^{\frac{ m _{1} + m _{2}}{2}} \Gamma \left( \frac{ m _{1} + m _{2}}{2}\right) \newline &= \frac{\Gamma \left( \frac{m _{1} + m _{2}}{2} \right)}{\Gamma \left( \frac{m _{1}}{2} \right) \Gamma \left( \frac{m _{2}}{2} \right)} \left( \frac{m _{1}}{m _{2}} \right) ^{\frac{ m _{1}}{2}} x ^{\frac{ m _{1}}{2} -1} \left( \frac{1}{\frac{m _{1}}{m _{2}}x + 1}\right) ^{\frac{ m _{1} + m _{2}}{2}} \newline &= \frac{1}{B \left(\frac{m _{1}}{2}, \frac{m _{2}}{2}\right)} \left( \frac{m _{1}}{m _{2}} \right) ^{\frac{ m _{1}}{2}} \frac{x ^{\frac{ m _{1}}{2} -1}}{\left(1 + \frac{m _{1}}{m _{2}}x\right) ^{\frac{ m _{1} + m _{2}}{2}}} \end{align} $$