ポアソン分布は、単位時間あたり平均$\lambda$回発生する事象のある時間中に発生する回数$X$が従う確率分布になります。
身近な例としては以下のようなものがあるでしょうか。
- 1ページあたり平均2個のタイプミスがある本で、ある1ページに何個のタイプミスがあるか。
- 1時間に平均10回の電話がかかってくるオフィスで、ある1時間に何回の電話がかかってくるか
- 1時間に平均6人の患者が受付に訪れる病院で、ある1時間に何人の患者が訪れるか
ポアソン分布の確率関数を導出する
ある時間間隔$T$の中で、事象が発生する回数$X$の分布を考えます。なお、その回数の期待値を$\lambda$とします。
上図のように、この区間$T$を$n$個の微小区間$t_{i}$に分割します。$n \rightarrow \infty$とすればこの微小区間は極めて小さいため、2回以上の事象が発生する確率を無視できます。 そうすると、各微小区間$t_{i}$で事象が発生する確率、発生しない確率はそれぞれ以下のように表せるでしょう。
$$ \begin{eqnarray} P(X_{i}=1) &=& \frac{\lambda}{n} \newline P(X_{i}=0) &=& 1-\frac{\lambda}{n} \end{eqnarray} $$
これはすなわち、対象区間$T$で事象が発生する回数の分布は二項分布$B(n,\frac{\lambda}{n})$に従うことを意味します。その確率は以下のようになります。
$$ P(X=k)= {\lim _{n \rightarrow \infty }} {}_{n} C _{k} \left( \frac{\lambda}{n} \right) ^{k} \left( 1 - \frac{\lambda}{n} \right) ^{n-k} $$
これを変形してみましょう。
$$ \begin{eqnarray} P(X=k) &=& \lim _{n \rightarrow \infty } \frac{n!}{k! (n-k)!} \left( \frac{\lambda}{n} \right) ^{k} \left( 1 - \frac {\lambda}{n} \right) ^{n-k} \newline &=& \lim _{n \rightarrow \infty } \frac{n(n-1)(n-2)\cdots (n-k+1)}{k!} \left( \frac{\lambda}{n} \right) ^{k} \left( 1 - \frac {\lambda}{n} \right) ^{n-k} \newline &=& \lim _{n \rightarrow \infty } \frac{n}{n}\frac{n-1}{n}\frac{n-2}{n}\cdots \frac{n-k+1}{n}\frac{\lambda ^ n}{k!}\left( 1 - \frac {\lambda}{n} \right) ^{k}\left( 1 - \frac {\lambda}{n} \right) ^{-k} \end{eqnarray} $$
何に収束するのか
考えなければならないのは以下の式です。
$$ \lim _{n \rightarrow \infty} \left( 1 - \frac {\lambda}{n} \right) ^{n} $$
ここでは、$t=-\frac{\lambda}{n}$と置いてみましょう。$n \rightarrow \infty$のとき、$t \rightarrow 0$になります。また、$n=-\frac{\lambda}{t}$ですね。この$t$を用いて上式を書き換えます。
$$ \begin{eqnarray} \lim _{n \rightarrow \infty} \left( 1 - \frac {\lambda}{n} \right) ^{n} &=& \lim _{t \rightarrow 0} ( 1+t ) ^{-\frac{\lambda}{t}} \newline &=& \lim _{t \rightarrow 0} \left( ( 1+t ) ^{\frac{1}{t}} \right) ^{-\lambda} \newline &=& e ^{-\lambda} \end{eqnarray} $$
これを用いると、求めたい確率$P(X=k)$はどうなるでしょうか。
$$ P(X=k) = \lim _{n \rightarrow \infty } \frac{n}{n}\frac{n-1}{n}\frac{n-2}{n}\cdots \frac{n-k+1}{n}\frac{\lambda ^ n}{k!}\left( 1 - \frac {\lambda}{n} \right) ^{k}\left( 1 - \frac {\lambda}{n} \right) ^{-k} = \frac{e ^{-\lambda}\lambda ^{k}}{k!} $$
つまり、単位時間で事象が発生する回数の期待値$\lambda$のとき、ある時間間隔$T$の中で事象の発生する回数$X$が$k$になる確率は以下のようになります。
$$ P(X=k) = \frac{e ^{-\lambda}\lambda ^{k}}{k!} $$
このとき確率変数$X$はポアソン分布$Po(\lambda)$に従う ($X \sim Po(\lambda)$)と言います。
ポアソン分布の平均と分散
上述の導出過程からも分かる通り、ポアソン分布は二項分布$B(n,\frac{\lambda}{n})$を$n \rightarrow \infty$としたときの確率分布です。
$Y \sim B(n,\frac{\lambda}{n})$について考えると、$E[Y]=n\frac{\lambda}{n}$です。また、$V[Y]=n\frac{\lambda}{n}(1-\frac{\lambda}{n})$でした。
では$X \sim Po(\lambda)$について考えます。
$$ \begin{eqnarray} E[X] &=& \lim _{n\rightarrow \infty } n\cdot \frac{\lambda}{n}=\lambda \newline V[X] &=& \lim _{n\rightarrow \infty } n\cdot \frac{\lambda}{n}\cdot (1-\frac{\lambda}{n}) = \lambda \end{eqnarray} $$