前回のエントリで導出した2変量正規分布に関する確率密度関数は次の式でした。
$$ f(X) = \frac{1}{2\pi \sqrt{\sigma _{x} ^{2} \sigma _{y} ^{2} (1 - \rho ^{2})}} \exp{\left( -\frac{1}{2(1 - \rho ^{2})} \left( \left( \frac{x - \mu _{x}}{\sigma _{x}}\right) ^{2} - 2\rho \frac{x - \mu _{x}}{\sigma _{x}}\frac{y - \mu _{y}}{\sigma _{y}} + \left( \frac{y - \mu _{y}}{\sigma _{y}} \right) ^{2} \right) \right)} $$
今回はこの2変量正規分布に関して、$X=x$を与えた時の$Y$の分布(つまりは条件付き分布)の確率密度関数を導出し、その期待値と分散を示します。
求めるべき確率密度関数$f(Y|X)$は条件付き関数であることから、次のような式として示せます。 $f(x,y)$が2変量正規分布の確率密度関数であり、$f(x)$は通常の(1変量の)正規分布の確率密度関数です。
$$ \begin{align} f(Y|X) &= \frac{f(x,y)}{f(x)} \newline &= \frac{\frac{1}{2\pi \sqrt{\sigma _{x} ^{2} \sigma _{y} ^{2} (1 - \rho ^{2})}} \exp{\left( -\frac{1}{2(1 - \rho ^{2})} \left( \left( \frac{x - \mu _{x}}{\sigma _{x}}\right) ^{2} - 2\rho \frac{x - \mu _{x}}{\sigma _{x}}\frac{y - \mu _{y}}{\sigma _{y}} + \left( \frac{y - \mu _{y}}{\sigma _{y}} \right) ^{2} \right) \right)}}{\frac{1}{\sqrt{2\pi \sigma _{x}}} \exp \left( -\frac{(x - \mu _{x} ) ^2 }{2\sigma _x ^{2}} \right)} \newline &= \frac{1}{\sqrt{2 \pi} \cdot \sigma _{y} (1 - \rho ^2)} \exp{ \left( \left( -\frac{1}{2(1 - \rho ^{2})} \left( \left( \frac{x - \mu _{x}}{\sigma _{x}}\right) ^{2} - 2\rho \frac{x - \mu _{x}}{\sigma _{x}}\frac{y - \mu _{y}}{\sigma _{y}} + \left( \frac{y - \mu _{y}}{\sigma _{y}} \right) ^{2} \right) \right) + \frac{(x - \mu _{x} ) ^2 }{2\sigma _x ^{2}} \right) } \end{align} $$
ここで指数関数の中身を$g(x,y)$とおき、この$g(x,y)$を整理します。 式変形が複雑に見えますが、ここで行っているのは$y$に関する平方完成です。
$$ \begin{align} g(x,y) &= -\frac{1}{2(1 - \rho ^{2})} \left( \frac{ (x - \mu _{x} ) ^2}{\sigma _{x} ^2} - 2\rho \frac{x - \mu _{x}}{\sigma _{x}}\frac{ (y - \mu _{y} )}{\sigma _{y}} + \frac{ (y - \mu _{y} ) ^2}{\sigma _{y} ^2} - \frac{(x - \mu _{x} ) ^2 (1 - \rho ^2) }{\sigma _x ^{2}} \right) \newline &= -\frac{1}{2(1 - \rho ^{2})} \left( \frac{ (x - \mu _{x} ) ^2 (1 - (1 - \rho ^2))}{\sigma _{x} ^2} - 2\rho \frac{x - \mu _{x}}{\sigma _{x}}\frac{ (y - \mu _{y} )}{\sigma _{y}} + \frac{ (y - \mu _{y} ) ^2}{\sigma _{y} ^2} \right) \newline &= -\frac{1}{2(1 - \rho ^{2})} \left( \frac{ \rho ^2 (x - \mu _{x} ) ^2}{\sigma _{x} ^2} - 2\rho \frac{(x - \mu _{x} )y + (x - \mu _{x} ) \mu _{y}}{\sigma _{x} \sigma _{y}}+ \frac{ y ^2 - 2 \mu _{y} y + \mu _{y} ^2}{\sigma _{y} ^2} \right) \newline &= -\frac{1}{2 \sigma _{y} ^2 (1 - \rho ^{2})} \left( y ^2 - 2 \left( \frac{\sigma _{y} \rho (x - \mu _{x} )}{\sigma _{x}} + \mu _{y}\right) y + \frac{\sigma _{y} ^{2} \rho ^{2} (x - \mu _{x} ) ^2 }{ \sigma _{x} ^2} + 2\rho \frac{\sigma _{y}}{\sigma _{x}} \mu _{y} (x - \mu _{x}) + \mu _{y} ^{2}\right) \newline &= -\frac{1}{2 \sigma _{y} ^2 (1 - \rho ^{2})} \left( \left(y - \left( \mu _{y} + \frac{\sigma _{y} \rho (x - \mu _{x} )}{\sigma _{x}}\right) \right) ^{2} - \left( \mu _{y} ^2 + 2\rho \frac{\sigma _{y}}{\sigma _{x}}(x - \mu _{x}) + \frac{\sigma _{y} ^{2} \rho ^{2} (x - \mu _{x} ) ^2 }{ \sigma _{x} ^2}\right) + \frac{\sigma _{y} ^{2} \rho ^{2} (x - \mu _{x} ) ^2 }{ \sigma _{x} ^2} + 2\rho \frac{\sigma _{y}}{\sigma _{x}} \mu _{y} (x - \mu _{x}) + \mu _{y} ^{2} \right) \newline &= -\frac{\left(y - \left( \mu _{y} + \frac{\sigma _{y} \rho (x - \mu _{x} )}{\sigma _{x}}\right) \right) ^{2}}{2 \sigma _{y} ^2 (1 - \rho ^{2})} \newline &= -\frac{\left(y - \left( \mu _{y} + \rho \frac{\sigma _{y}}{\sigma _{x}} (x - \mu _{x} )\right) \right) ^{2}}{2 \sigma _{y} ^2 (1 - \rho ^{2})} \end{align} $$
式が綺麗になったので、これを$f(Y|X)$の式に代入すれば、求めるべき確率密度関数が現れます。
$$ f(Y|X) = \frac{1}{\sqrt{2 \pi} \cdot \sigma _{y} (1 - \rho ^2)} \exp{\left( -\frac{\left(y - \left( \mu _{y} + \rho \frac{\sigma _{y}}{\sigma _{x}} (x - \mu _{x} )\right) \right) ^{2}}{2 \sigma _{y} ^2 (1 - \rho ^{2})} \right)} $$
この式から、期待値・分散は次のようになることがわかります。
$$ \begin{align} E[Y | X = x] &= \mu _{y} + \rho \frac{\sigma _{y}}{\sigma _{x}} (x - \mu _{x} ) \newline V[Y | X = x] &= \sigma _{y} ^{2} (1 - \rho ^{2}) \end{align} $$