今日は懐かしの二項分布です。
二項分布を学ぶ上では、まずベルヌーイ分布を押さえておかなければなりません。
ベルヌーイ分布
ベルヌーイ試行
以下のような条件を満たす試行をベルヌーイ試行と呼びます。
- 取り得る結果が成功と失敗の2つである試行である
- 成功確率$p$、失敗確率$q=1-p$は変化しない
コイン投げ、サイコロを振って特定の目が出るか、あるいは成功確率が変わらないのであればバスケットボールのフリースローもベルヌーイ試行の例になります。
ベルヌーイ分布
成功確率$p$のベルヌーイ試行を1回行うときの成功回数$X$の確率分布をベルヌーイ分布と呼び、$X \sim Be(p)$で表します。確率関数はもちろん以下のようになりますね。
$$ \begin{eqnarray} P(X=1) &=&p \newline P(X=0) &=&1-p \end{eqnarray} $$
ベルヌーイ分布の期待値、分散
期待値、分散はそれぞれ以下の式で表現されます。
$$ \begin{eqnarray} \mu &=& E \lbrack X \rbrack = 1\cdot p + 0\cdot (1-p) = p \newline \sigma ^2 &=& E \lbrack X ^2 \rbrack - \mu ^2 = \left( 1 ^2 \cdot p + 0 ^2 \cdot (1-p) \right) - p ^2 = p(1-p) \end{eqnarray} $$
二項分布
成功確率$p$のベルヌーイ試行を$n$回行ったときの成功回数$X$の分布を二項分布と呼びます。
成功回数$x$となる確率は$p ^x$、失敗回数が$n-x$となる確率は$(1-p) ^{n-x}$、成功と失敗の組み合わせの数が$_{n}C_{x}$個あるため、成功の回数$X=x$となる確率は以下のようになります。
$$ P(X=x)=_{n}C_{x}p ^{x} (1-p) ^{n-x} $$
二項分布の確率分布はパラメータ$(n,p)$で与えられ、$B(n,p)$で表現されます。
二項分布の期待値・分散
二項分布の期待値を定義に当てはめて求めても良いのですが、すこし面倒なので楽な方法で計算します。 まず、各回のベルヌーイ試行の結果を表す確率変数を$X_{i}$とすると、二項分布$B(n,p)$に従う確率変数は独立なベルヌーイ分布$n$個の和で表されます。
$$ X=\sum_{i=1} ^{n} X_{i} $$
確率変数の和の期待値はそれぞれの期待値の和に等しいことを鑑み、上式の議論を進めます。
$$ E(X)=\sum_{i=1} ^{n} E( X_{i} ) =\sum_{i=1} ^{n} p = np $$
分散の議論も同様になります。
$$ V(X)=\sum_{i=1} ^{n} V( X_{i} ) = \sum_{i=1} ^{n} p(1-p) = np(1-p) $$