理系学生日記

おまえはいつまで学生気分なのか

ポアソン分布の確率関数を導出する

ポアソン分布は、単位時間あたり平均$\lambda$回発生する事象のある時間中に発生する回数$X$が従う確率分布になります。

身近な例としては以下のようなものがあるでしょうか。

  • 1ページあたり平均2個のタイプミスがある本で、ある1ページに何個のタイプミスがあるか。
  • 1時間に平均10回の電話がかかってくるオフィスで、ある1時間に何回の電話がかかってくるか
  • 1時間に平均6人の患者が受付に訪れる病院で、ある1時間に何人の患者が訪れるか

ポアソン分布の確率関数を導出する

ある時間間隔$T$の中で、事象が発生する回数$X$の分布を考えます。なお、その回数の期待値を$\lambda$とします。

上図のように、この区間$T$を$n$個の微小区間$t_{i}$に分割します。$n \rightarrow \infty$とすればこの微小区間は極めて小さいため、2回以上の事象が発生する確率を無視できます。 そうすると、各微小区間$t_{i}$で事象が発生する確率、発生しない確率はそれぞれ以下のように表せるでしょう。

$$ \begin{eqnarray} P(X_{i}=1) &=& \frac{\lambda}{n} \newline P(X_{i}=0) &=& 1-\frac{\lambda}{n} \end{eqnarray} $$

これはすなわち、対象区間$T$で事象が発生する回数の分布は二項分布$B(n,\frac{\lambda}{n})$に従うことを意味します。その確率は以下のようになります。

$$ P(X=k)= {\lim _{n \rightarrow \infty }} {}_{n} C _{k} \left( \frac{\lambda}{n} \right) ^{k} \left( 1 - \frac{\lambda}{n} \right) ^{n-k} $$

これを変形してみましょう。

$$ \begin{eqnarray} P(X=k) &=& \lim _{n \rightarrow \infty } \frac{n!}{k! (n-k)!} \left( \frac{\lambda}{n} \right) ^{k} \left( 1 - \frac {\lambda}{n} \right) ^{n-k} \newline &=& \lim _{n \rightarrow \infty } \frac{n(n-1)(n-2)\cdots (n-k+1)}{k!} \left( \frac{\lambda}{n} \right) ^{k} \left( 1 - \frac {\lambda}{n} \right) ^{n-k} \newline &=& \lim _{n \rightarrow \infty } \frac{n}{n}\frac{n-1}{n}\frac{n-2}{n}\cdots \frac{n-k+1}{n}\frac{\lambda ^ n}{k!}\left( 1 - \frac {\lambda}{n} \right) ^{k}\left( 1 - \frac {\lambda}{n} \right) ^{-k} \end{eqnarray} $$

何に収束するのか

考えなければならないのは以下の式です。

$$ \lim _{n \rightarrow \infty} \left( 1 - \frac {\lambda}{n} \right) ^{n} $$

ここでは、$t=-\frac{\lambda}{n}$と置いてみましょう。$n \rightarrow \infty$のとき、$t \rightarrow 0$になります。また、$n=-\frac{\lambda}{t}$ですね。この$t$を用いて上式を書き換えます。

$$ \begin{eqnarray} \lim _{n \rightarrow \infty} \left( 1 - \frac {\lambda}{n} \right) ^{n} &=& \lim _{t \rightarrow 0} ( 1+t ) ^{-\frac{\lambda}{t}} \newline &=& \lim _{t \rightarrow 0} \left( ( 1+t ) ^{\frac{1}{t}} \right) ^{-\lambda} \newline &=& e ^{-\lambda} \end{eqnarray} $$

これを用いると、求めたい確率$P(X=k)$はどうなるでしょうか。

$$ P(X=k) = \lim _{n \rightarrow \infty } \frac{n}{n}\frac{n-1}{n}\frac{n-2}{n}\cdots \frac{n-k+1}{n}\frac{\lambda ^ n}{k!}\left( 1 - \frac {\lambda}{n} \right) ^{k}\left( 1 - \frac {\lambda}{n} \right) ^{-k} = \frac{e ^{-\lambda}\lambda ^{k}}{k!} $$

つまり、単位時間で事象が発生する回数の期待値$\lambda$のとき、ある時間間隔$T$の中で事象の発生する回数$X$が$k$になる確率は以下のようになります。

$$ P(X=k) = \frac{e ^{-\lambda}\lambda ^{k}}{k!} $$

このとき確率変数$X$はポアソン分布$Po(\lambda)$に従う ($X \sim Po(\lambda)$)と言います。

ポアソン分布の平均と分散

上述の導出過程からも分かる通り、ポアソン分布は二項分布$B(n,\frac{\lambda}{n})$を$n \rightarrow \infty$としたときの確率分布です。

$Y \sim B(n,\frac{\lambda}{n})$について考えると、$E[Y]=n\frac{\lambda}{n}$です。また、$V[Y]=n\frac{\lambda}{n}(1-\frac{\lambda}{n})$でした。

では$X \sim Po(\lambda)$について考えます。

$$ \begin{eqnarray} E[X] &=& \lim _{n\rightarrow \infty } n\cdot \frac{\lambda}{n}=\lambda \newline V[X] &=& \lim _{n\rightarrow \infty } n\cdot \frac{\lambda}{n}\cdot (1-\frac{\lambda}{n}) = \lambda \end{eqnarray} $$