2016/09/20
2020/05/05
二項分布のわかりやすいまとめ
二項分布についてわかりやすくまとめました。以下の表は二項分布の基本的な特性一覧になります。
パラメーター | \(n,p\) |
範囲 | \(0≦x≦n\) x:成功回数 |
確率密度関数 | \(f\left( x\right) =\begin{pmatrix} n \\ x \end{pmatrix}p^{x}q^{n-x}\) |
分布関数 | \(F\left( x\right) =\sum^{x}_{k=0}\begin{pmatrix} n \\ k \end{pmatrix}p^{k}q^{n-k}\) |
積率母関数 | \((pe^t+q)^n\) |
特性関数 | \((pe^{it}+q)^n\) |
キュムラント母関数 | \(nlog(pe^t+q)\) |
期待値 | \(E(X)=np\) |
分散 | \(Var(X)=npq\) |
最頻値 | \(p(n+1)-1≦x≦p(n+1)\) |
歪度 | \(\frac{q-p}{\sqrt{npq}}\) |
目次
二項分布とは?
二項分布(Binomial Distribution)とは、互いに独立したベルヌーイ試行をn回行ったときに、ある事象が何回起こるかの確率分布です。例えば、「コインを5回投げた時に表2回出る確率」「対戦ゲームで90%の確率で当たる技を10回中8回当てる確率」などを表した確率分布です。
(ベルヌーイ試行とは、試行結果が成功か失敗かの2通りしかない試行をさします。例えば、「サイコロを投げた場合1なのか、それ以外なのか?」というのを考える場合これはベルヌーイ試行ですが、「サイコロを投げてどの目が出るか?」というのを考えるのはベルヌーイ試行ではありません。ベルヌーイ試行について詳しくはベルヌーイ試行の定義を丁寧にわかりやすく解説をご覧下さい。)
また、ベルヌーイ試行がの回数が一回のとき(すなわちn = 1のとき)、二項分布はベルヌーイ分布となります。
二項分布と正規分布
二項分布\(B(n.p)\)は\(n\)が十分に大きいとき、平均\(np\)、分散\(np(1-p)\)の正規分布に近づきます。また、\(\frac{X-np}{\sqrt{np(1-p)}}\)は近似的に標準正規分布に従います。これをド・モアブルー・ラプラスの定理と言います。正規分布につてはこちら→正規分布のわかりやすいまとめ
確率質量関数
二項分布の確率質量関数は、ベルヌーイ分布の確率質量関数と非常によく似ています。
$$f\left( x\right) =\begin{pmatrix} n \\ x \end{pmatrix}p^{x}(1-p)^{n-x}$$
積率母関数
二項分布の積率母関数は以下のようにして導出されます。
\(\begin{eqnarray*}M_X(t)&=&E(\mathrm{e}^{tk})\\ &=&\sum_{k=0}^{n}\mathrm{e}^{tk}P(X=k)\\ &=&\sum_{k=0}^{n}\mathrm{e}^{tk}\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}\mathrm{e}^{tk}\ _n C_k p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}\ _n C_k {(\mathrm{e}^tp)}^{k}{(1-p)}^{n-k}\\ &=&{(\mathrm{e}^tp+1-p)}^n \end{eqnarray*}\)
期待値、分散の導出(密度関数より)
期待値の導出
\(\begin{eqnarray*}E(X)&=&\sum_{k=0}^{n}kP(X=k)\\ &=&\sum_{k=0}^{n}k\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}k\ _n C_k p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}k\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}\frac{n {(n-1)}!}{{(n-k)}!{(k-1)}!}p p^{k-1}{(1-p)}^{n-k}\\ &=&np\sum_{k=0}^{n}\frac{{(n-1)}!}{{((n-1)-(k-1))}!{(k-1)}!}p^{k-1}{(1-p)}^{n-k}\\ &=&np\end{eqnarray*}\)
さらに詳しい説明→二項分布の期待値の導出(証明)
分散の導出
\(\begin{eqnarray*}E(X^2)&=&\sum_{k=0}^{n}k^2P(X=k)\\ &=&\sum_{k=0}^{n}k^2\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}k^2\ _n C_k p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}(k(k-1)+k)\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}k(k-1)\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}+\sum_{k=0}^{n}k\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\end{eqnarray*}\)
\(\begin{eqnarray*}\ \ \ \ \ \ \ \ \ \ \ &=&\sum_{k=0}^{n}\frac{n!}{{(n-k)}!(k-2)!}p^{k}{(1-p)}^{n-k}+np\\ &=&\sum_{k=0}^{n}\frac{n(n-1)(n-2)!}{{(n-k)}!(k-2)!}p^2p^{k-2}{(1-p)}^{n-k}+np\\ &=&n(n-1)p^2\sum_{k=0}^{n}\frac{(n-2)!}{{((n-2)-(k-2))}!(k-2)!}p^{k-2}{(1-p)}^{n-k}+np\\ &=&n(n-1)p^2+np\end{eqnarray*}\)
\(\begin{eqnarray*}V(X)&=&E(X^2)-{(E(X))}^2\\ &=&n(n-1)p^2+np-{(np)}^2\\ &=&np(1-p) \end{eqnarray*}\)
さらに詳しい説明→二項分布の分散導出(証明)
期待値、分散の導出(積率母関数より)
積率母関数からの期待値の導出
\(\begin{eqnarray*}E(X)&=&\left.\frac{d{M_x}(t)}{dt}\right|_{t=0}\\ &=&n{(\mathrm{e}^tp+1-p)}^{n-1}p\mathrm{e}^t|_{t=0}\\ &=&n{(1-p+p)}^{n-1}p\\ &=&np\end{eqnarray*}\)
積率母関数からの分散の導出
\(\begin{eqnarray*}E(X^2)&=&\left.\frac{d^2{M_x}(t)}{dt^2}\right|_{t=0}\\ &=&{(np(\mathrm{e}^tp+1-p)^{n-1}\mathrm{e}^t)}’|_{t=0}\\ &=&n(n-1)p(\mathrm{e}^{t}p+1-p)^{n-2}p\mathrm{e}^t+np(\mathrm{e}^tp+1-p)^{n-1}\mathrm{e}^t\\ &=&n(n-1)p^2+np\\\\ V(X)&=&E(X^2)-{E(X)}^2\\ &=&np(1-p) \end{eqnarray*}\)
二項分布の最頻値
最頻値とは、確率質量関数\(f(x)\)が最大となる\(x\)をさします。そして、この場合\(f(x)\)は常に正の値をとるので、
\(\begin{eqnarray*}f\left( x\right) -f\left( x-1\right) ≧0\\ \end{eqnarray*}\)
を満たす最大のxが最頻値です。これで計算を進めると最頻値\(x\)は、
\(p(n+1)-1≦x≦p(n+1)\)
を満たす整数\(x\)となります。(等号成立時に最頻値は二つになります。)
さらに詳しい導出過程→二項分布の最頻値を導出(確率質量関数より)
二項分布の歪度・尖度
歪度
\(\begin{eqnarray*}\dfrac {E\left[ \left( x-\mu\right) ^{3}\right] }{\sigma^{3}}&=&\dfrac {np\left( p-1\right) \left( 2p-1\right) }{np\left( 1-p\right) \sqrt {np\left( 1-p\right) }}\\ &=&\dfrac {1-2p}{\left( 1-p\right) \sqrt {np\left( 1-p\right) }}\end{eqnarray*}\)
さらに詳しい導出過程→二項分布の歪度の導出
尖度
\(\begin{eqnarray*}\dfrac {E\left[ \left( x-\mu\right)^4\right] }{\sigma^{4}}-3&=&\dfrac {np\left( 1-p\right) \left( 1+3(n-2\right) p\left( 1-P\right) }{n^{2}p^{2}\left( 1-p\right) ^{2}}-3\\ &=&\dfrac {1-6p\left( 1-p\right) }{np\left( 1-p\right) ^{2}}\end{eqnarray*}\)
さらに詳しい導出過程→二項分布の尖度の導出
Recommended