理系学生日記

おまえはいつまで学生気分なのか

幾何分布の導出、期待値と分散

今日は幾何分布です。

幾何分布

成功の確率が$p$であるベルヌーイ試行を繰り返したとき、初めて成功するまでの試行回数$X$が従う確率分布を幾何分布と言います。 ベルヌーイ試行については二項分布の期待値と分散 - 理系学生日記の通り、以下のような試行のことでした。

  • 取り得る結果が成功と失敗の2つである試行である
  • 成功確率$p$、失敗確率$q=1-p$は変化しない

まずは幾何分布の確率関数を導出してみましょう。

初めて成功するのが$x$回目だとすると、$(x-1)$回目まではずっと失敗だと言うことです。従って導出は素直で、以下の式がその確率関数になります。

$$ P(X=x)=(1-p) ^{x-1}p $$

期待値

幾何分布の期待値を定義通り求めてみましょう。

$$ E[X]=\sum_{n=1} ^{\infty} np(1-p) ^{n-1} = p\sum_{n=1} ^{\infty} n(1-p) ^{n-1} $$

$\sum$の中にある$n$さえなくせれば無限等比数列の和に帰着できますね。これをなんとかしたい。

ここで両辺に$(1-p)$を乗じます。

$$ (1-p)E[X] = p\sum_{n=1} ^{\infty}n(1-p) ^{n} $$

ここで$t=n+1$とおくと$n=t-1$です。$n=1$のとき$t=2$、$n\rightarrow \infty$のときは$t\rightarrow \infty$です。この$t$を用いて上式を表します。

$$ (1-p)E[X] = p\sum_{t=2} ^{\infty}(t-1)(1-p) ^{t-1} $$

$t=1$のとき$(t-1)(1-p) ^{t-1}=0$なので、上の式は以下のようにも書けます。

$$ (1-p)E[X] = p\sum_{t=2} ^{\infty}(t-1)(1-p) ^{t-1} = p\sum_{t=1} ^{\infty}(t-1)(1-p) ^{t-1} $$

ではここで最初の$E[X]$の式から上の$(1-p)E[X]$の式を引いてみましょう。

$$ \begin{eqnarray} E[X]-(1-p)E[X]=pE[X] &=& p\left( \sum_{n=1} ^{\infty}n(1-p) ^{n-1} - \sum_{t=1} ^{\infty}(t-1)(1-p) ^{t-1} \right) \newline &=& p\left( \sum_{n=1} ^{\infty}(n-(n-1))(1-p) ^{n-1}\right) \newline &=& p\sum_{n=1} ^{\infty}(1-p) ^{n-1} \end{eqnarray} $$

これでようやく、初項$1$、公比$1-p$である等比数列の無限和に帰着できました。 結果として、幾何分布の期待値は$\frac{1}{p}$であることが導けます。

$$ \therefore E[X] = \sum_{n=1} ^{\infty} (1-p) ^{n-1} = \frac{1}{1-(1-p)}=\frac{1}{p} $$

分散

確率分布の基礎 - 理系学生日記で記載の通り、 $V[X]=E[X ^2]-E[X] ^2$です。上で$E[X]$は求めているので、$E[X ^2]$がもとまれば分散$V[X]$が示せます。

$$ E[X ^2] = \sum_{n=1} ^{\infty} n ^2 p (1-p) ^{n-1} = p\sum_{n=1} ^{\infty} n ^2(1-p) ^{n-1} $$

また面倒な式ですね。やはり何とか無限等比数列の和の形に持っていきたい。 期待値のときと同様に、まずは両辺に$(1-p)$をかけましょう。また、$(1-p)$の肩の数字を上式と合わせるべく、$t=n+1$と変換します。

$$ \begin{eqnarray} (1-p)E[X ^2] &=& p\sum_{n=1} ^{\infty}n ^2(1-p) ^{n} \newline &=& p\sum_{t=2} ^{\infty}(t-1) ^2(1-p) ^{t-1} \newline &=& p\sum_{t=1} ^{\infty}(t-1) ^2(1-p) ^{t-1} \end{eqnarray} $$

ここで$E[X ^2]$の式から$(1-p)E[X ^2]$の式をひきます。

$$ \begin{eqnarray} E[X ^2]-(1-p)E[X ^2]=pE[X] &=& p\sum_{n=1} ^{\infty}\left( n ^2(1-p) ^{n-1} - (n-1) ^2 (1-p) ^{n-1}\right) \newline &=& p\sum_{n=1} ^{\infty}(2n-1)(1-p) ^{n-1} \newline \therefore E[X ^2] &=& \sum_{n=1} ^{\infty}(2n-1)(1-p) ^{n-1} \end{eqnarray} $$

めでたく$\sum$の中の次数が下がりました。この操作をもう一度繰り返せばさらに次数が下がり、無限等比数列の和に帰着できそうです。

両辺に$(1-p)$を乗じ、さらに$t=n+1$と変換します。

$$ \begin{eqnarray} (1-p)E[X ^2] &=&\sum_{n=1} ^{\infty}(2n-1)(1-p) ^{n} \newline &=& \sum_{t=2} ^{\infty}(2(t-1)-1)(1-p) ^{t-1} \newline &=& \sum_{t=2} ^{\infty}(2t-3)(1-p) ^{t-1} \end{eqnarray} $$

$\sum$は$t=2$からではなく$t=1$から始めたいですね。$t=1$のとき$(2t-3)(1-p) ^{t-1}=-1$であることを鑑みると、上式は次のように変形できます。

$$ \begin{eqnarray} (1-p)E[X ^2] &=& \sum_{t=2} ^{\infty}(2t-3)(1-p) ^{t-1} \newline &=& \sum_{t=1} ^{\infty}(2t-3)(1-p) ^{t-1} + 1 \end{eqnarray} $$

では$E[X ^2]$の式から上の$(1-p)E[X ^2]$の式を引いてみましょう。

$$ \begin{eqnarray} pE[X ^2] &=& \sum_{n=1} ^{\infty} \left( (2n-1)(1-p) ^{n-1} )- (2n-3)(1-p) ^{n-1} \right) - 1 \newline &=& 2 \sum_{n=1} ^{\infty}(1-p) ^{n-1} - 1 \newline &=& 2 \cdot \frac{1}{(1-(1-p))} - 1 \newline &=& \frac{2-p}{p} \newline \therefore E[X ^2] &=& \frac{2-p}{p ^2} \end{eqnarray} $$

ようやく$E[X ^2]$が求められました。これで分散$V[X]$が求まります。

$$ \begin{eqnarray} V[X] &=& E[X ^2]-E[X] ^2 \newline &=& \frac{2-p}{p ^2} - \left(\frac{1}{p} \right) ^2 \newline &=& \frac{1-p}{p ^2} \end{eqnarray} $$