2017/09/27
2020/04/14
中心極限定理の例とメリットをわかりやすく解説
平均\(\mu\)、分散\(\sigma^2\)をもつあらゆる分布からの無作為標本の標本平均\(X\)の分布はnが十分大きいとき以下の式が成立する。
わかりやすい説明
ここでは、厳密な説明ではなく、中心極限定理を感覚的に理解できるような記述を心がけました。
まず、どのような分布に従うかわからない母集団から無作為に抽出した標本を\(X_{1},X_{2}、、、、、,X_{n}\)します。
このnが十分に大きい時を考えると以下の式が成立して良いことにする定理なのです。
$$S_{n}=X_{1}+X_{2}+、、、、+X_{n} \overset{}{\sim} N(n \mu,n \sigma^2)\\\overline{X}=X_{1}+X_{2}+、、、、+X_{n}/n\overset{}{\sim} N(\mu,\sigma^2/n)$$
しかし、この式を見ても中心極限定理の概念を理解することは難しいですよね。そこで、一様分布の例を用いて考えて見たいと思います。
一様分布を使った例
さいころの目のような一様分布を例にとって考えてみます。サイコロの目がでる確率はどの目も一様で、\(\frac{1}{6}\)です。
サイコロの目 | 1 | 2 | 3 | 4 | 5 | 6 |
確率 | \(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\) | \(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\) | \(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\) | \(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\) | \(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\) | \(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\) |
しかし、6回サイコロを投げた時の目の合計を考えた時はどうでしょう。6回全部1の目がでて合計が6になる可能性や、全部6の目がでて合計が36になる可能性が低いことはすぐにわかっていただけるかと思います。では、合計はどのくらいになると考えるのが自然でしょう。サイコロを一回投げた時の目の期待値(平均値)は、\(E(X)=(1+2+3+4+5+6)/6=\frac{7}{2}\)です。6回サイコロを投げる試行を繰り返したとき、合計値が\(\frac{7}{2}×6=21\)になる可能性が一番高そうであることも想像できるかと思います。
この図表から、サイコロを2回振った時の合計の確率分布は正規分布のような形になっていることが分かります。この図表を見ると、サイコロの目の和\(S_{n}\)が正規分布に近似できることが感覚的に理解できるかと思います。
ただ、正規分布のままではパラメータによって数値が変動するため、標準化してより扱いやすい形にしてあげましょう。標準化については、正規分布を標準化する方法と意味と例題と証明で詳しく記述していますので参考にしてください。
$$\overline{X} \overset{}{\sim} N(n\mu,\sigma^2/n)$$
$$\overline{X}-\mu \overset{}{\sim} N(0,\sigma^2/n)$$ $$\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \overset{}{\sim} N(0,1)$$ これより、 確率変数\(\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\)は標準正規分布に従うことがわかるため、$$\begin{eqnarray*}\lim_{n \to \infty} P(Z_{n} \leq z)=\Phi(z)=\int_\infty^z \frac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^2}{2}} dx\end{eqnarray*}$$
が導出することができました。
中心極限定理が使えるメリットとは
中心極限定理が使えると何が便利なのでしょう。下の例をご覧ください。
例題
サイコロを100回振った時、その目の和が300以上420以下となる確率を求めよ。
解答
サイコロの出る目\(X\)は\(\mu=\frac{7}{2}\)、\(\sigma^2=\frac{35}{12}\)の離散一様分布に従う。
出る目の和\(S_{n}=X_{1}+X_{2}+,…,+X_{n}\)は、中心極限定理の
$$S_{n}=X_{1}+X_{2}+,…,+X_{n} \overset{}{\sim} N(n \mu,n \sigma^2)$$
を適用すると、 $$S_{n}\overset{}{\sim} N(350,\frac{3500}{12})$$
が言える。これを標準化すると、
$$ S_{n}-350 \overset{}{\sim} N(0,\frac{3500}{12})\\\frac{S_{n}-350}{\sqrt{\frac{3500}{12}}} \overset{}{\sim} N(0,1)$$
$$\begin{eqnarray*}P(300\leq S_{n} \leq 420)
&=&P(\frac{300-350}{\sqrt{\frac{3500}{12}}} \leq \frac{S_{n}-350}{\sqrt{\frac{3500}{12}}} \leq \frac{420-350}{\sqrt{\frac{3500}{12}}})\\
&=&P(-\frac{50}{17.08} \leq \frac{S_{n}-350}{\sqrt{\frac{3500}{12}}} \leq \frac{70}{17.08})\\
&=&P(-2.93 \leq \frac{S_{n}-350}{\sqrt{\frac{3500}{12}}} \leq 4.10)\\&=&1-0.0017-0.00002\\&=&0.9981\end{eqnarray*}$$
まとめ
中心極限定理がない場合、目の和が300になる可能性と241になる可能性と、、、のように調べ上げていかなくてはならず、大変手間がかかってしまいます。
しかし、中心極限定理を使うことにより、数え上げて行く手間を省くことができます。
このように中心極限定理は母集団がいかなる分布に従っていても使うことができるので汎用性がたかく、非常に便利なのです。
最新投稿記事
-
AIプロジェクトの企画と失敗しない進め方を解説 2021年1月19日
-
AVILEN人材育成コース受講体験談:山田裕之さん「E資格の”その先”を目指して」 2021年1月8日
-
AI導入とは?RPAとの関係、プロセス、事例、メリット、費用を詳細に解説 2020年12月7日
-
注目のAI開発企業11社!支援領域や提供方法など検証! 2020年10月28日
-
AI人材を育成できる研修プログラムを一挙紹介! 2020年10月20日
-
【2021年版】期待のAI資格11選!就職・転職にも使える! 2020年10月18日
-
JDLAとは?G検定、E資格の認定プログラム、合格者の会など紹介! 2020年10月14日
-
G検定(2020#3)受験申し込み開始、11月7日(土)実施-JDLA 2020年10月1日
-
【独占】コロナ禍で人材登録急増、アノテーション単月売上高は4倍超-パソナJOB HUB 2020年10月1日
-
E資格を転職に活用!評判とデータを徹底調査! 2020年9月29日
週間ランキング
【2021年版】コスパ重視のG検定対策!おすすめの本・講座・教材を一挙紹介! 2020年6月6日
G検定に短期間・独学で合格した勉強法を解説! 2020年8月3日
【2021年版】期待のAI資格11選!就職・転職にも使える! 2020年10月18日
G検定は難しい?難易度・合格ライン・問題を徹底解説! 2020年6月19日
注目のAI開発企業11社!支援領域や提供方法など検証! 2020年10月28日
G検定に落ちた人、合格した人。勉強法の違いはどこにある? 2020年6月25日
最弱オセロを初めて攻略した天才オセロ高校生。負け方を解説! 2020年7月31日
【2021年版】E資格とは?大注目のディープラーニングの資格を解説! 2020年9月29日
E資格の難易度を、合格率と問題から徹底分析! 2020年8月11日
MLOpsとは|定義、メリット、課題、ツール、ワークフローを分かりやすく解説 2020年9月18日

COMMENT
-
su 2018.4.25 6:11 PM
例題の答え合ってますか?
手元で計算したら$\frac{653318623488084065789005989366897230712647273602379087792875818784707960241055}{653318623500070906096690267158057820537143710472954871543071966369497141477376}$
で、およそ 0.999999999981652 となりました。$\sqrt{\frac{3500}{12}}$ が 59.16 というのがよく分かりません。
-
y0he1 2018.5.21 9:07 AM
コメントありがとうございます。
おっしゃる通りで
\sqrt{\frac{3500}{12}}$ を 59.16
と計算したことにより回答が間違っていました。これだと確率が小さくなりすぎるため、例題の数値を少し変更し、回答を訂正さていただきました。
su 2018.4.25 6:11 PM
例題の答え合ってますか?
手元で計算したら
$\frac{653318623488084065789005989366897230712647273602379087792875818784707960241055}{653318623500070906096690267158057820537143710472954871543071966369497141477376}$
で、およそ 0.999999999981652 となりました。
$\sqrt{\frac{3500}{12}}$ が 59.16 というのがよく分かりません。
y0he1 2018.5.21 9:07 AM
コメントありがとうございます。
おっしゃる通りで
\sqrt{\frac{3500}{12}}$ を 59.16
と計算したことにより回答が間違っていました。
これだと確率が小さくなりすぎるため、例題の数値を少し変更し、回答を訂正さていただきました。