2017/09/27

2020/04/14

中心極限定理の例とメリットをわかりやすく解説

統計学の基礎

ライター:

中心極限定理

平均\(\mu\)、分散\(\sigma^2\)をもつあらゆる分布からの無作為標本の標本平均\(X\)の分布はnが十分大きいとき以下の式が成立する。

\(\lim_{n \to \infty} P(Z_{n} \leq z)=\Phi(z)=\int_\infty^z \frac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^2}{2}} dx\)

わかりやすい説明

ここでは、厳密な説明ではなく、中心極限定理を感覚的に理解できるような記述を心がけました。

まず、どのような分布に従うかわからない母集団から無作為に抽出した標本を\(X_{1},X_{2}、、、、、,X_{n}\)します。

このnが十分に大きい時を考えると以下の式が成立して良いことにする定理なのです。

$$S_{n}=X_{1}+X_{2}+、、、、+X_{n} \overset{}{\sim} N(n \mu,n \sigma^2)\\\overline{X}=X_{1}+X_{2}+、、、、+X_{n}/n\overset{}{\sim} N(\mu,\sigma^2/n)$$

しかし、この式を見ても中心極限定理の概念を理解することは難しいですよね。そこで、一様分布の例を用いて考えて見たいと思います。

一様分布を使った例

さいころの目のような一様分布を例にとって考えてみます。サイコロの目がでる確率はどの目も一様で、\(\frac{1}{6}\)です。

サイコロの目123456
確率\(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\)\(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\)\(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\)\(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\)\(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\)\(\begin{eqnarray*}\frac{1}{6}\end{eqnarray*}\)

しかし、6回サイコロを投げた時の目の合計を考えた時はどうでしょう。6回全部1の目がでて合計が6になる可能性や、全部6の目がでて合計が36になる可能性が低いことはすぐにわかっていただけるかと思います。では、合計はどのくらいになると考えるのが自然でしょう。サイコロを一回投げた時の目の期待値(平均値)は、\(E(X)=(1+2+3+4+5+6)/6=\frac{7}{2}\)です。6回サイコロを投げる試行を繰り返したとき、合計値が\(\frac{7}{2}×6=21\)になる可能性が一番高そうであることも想像できるかと思います。

 この図表から、サイコロを2回振った時の合計の確率分布は正規分布のような形になっていることが分かります。この図表を見ると、サイコロの目の和\(S_{n}\)が正規分布に近似できることが感覚的に理解できるかと思います。

ただ、正規分布のままではパラメータによって数値が変動するため、標準化してより扱いやすい形にしてあげましょう。標準化については、正規分布を標準化する方法と意味と例題と証明で詳しく記述していますので参考にしてください。

$$\overline{X} \overset{}{\sim} N(n\mu,\sigma^2/n)$$

$$\overline{X}-\mu \overset{}{\sim} N(0,\sigma^2/n)$$ $$\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \overset{}{\sim} N(0,1)$$ これより、 確率変数\(\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\)は標準正規分布に従うことがわかるため、$$\begin{eqnarray*}\lim_{n \to \infty} P(Z_{n} \leq z)=\Phi(z)=\int_\infty^z \frac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^2}{2}} dx\end{eqnarray*}$$

が導出することができました。

中心極限定理が使えるメリットとは

中心極限定理が使えると何が便利なのでしょう。下の例をご覧ください。

例題

例題

サイコロを100回振った時、その目の和が300以上420以下となる確率を求めよ。

解答

サイコロの出る目\(X\)は\(\mu=\frac{7}{2}\)、\(\sigma^2=\frac{35}{12}\)の離散一様分布に従う。

出る目の和\(S_{n}=X_{1}+X_{2}+,…,+X_{n}\)は、中心極限定理の

$$S_{n}=X_{1}+X_{2}+,…,+X_{n} \overset{}{\sim} N(n \mu,n \sigma^2)$$

を適用すると、 $$S_{n}\overset{}{\sim} N(350,\frac{3500}{12})$$

が言える。これを標準化すると、

$$ S_{n}-350 \overset{}{\sim} N(0,\frac{3500}{12})\\\frac{S_{n}-350}{\sqrt{\frac{3500}{12}}} \overset{}{\sim} N(0,1)$$

$$\begin{eqnarray*}P(300\leq S_{n} \leq 420)
&=&P(\frac{300-350}{\sqrt{\frac{3500}{12}}} \leq \frac{S_{n}-350}{\sqrt{\frac{3500}{12}}} \leq \frac{420-350}{\sqrt{\frac{3500}{12}}})\\
&=&P(-\frac{50}{17.08} \leq \frac{S_{n}-350}{\sqrt{\frac{3500}{12}}} \leq \frac{70}{17.08})\\
&=&P(-2.93 \leq \frac{S_{n}-350}{\sqrt{\frac{3500}{12}}} \leq 4.10)\\&=&1-0.0017-0.00002\\&=&0.9981\end{eqnarray*}$$ 

まとめ

中心極限定理がない場合、目の和が300になる可能性と241になる可能性と、、、のように調べ上げていかなくてはならず、大変手間がかかってしまいます。

しかし、中心極限定理を使うことにより、数え上げて行く手間を省くことができます。

このように中心極限定理は母集団がいかなる分布に従っていても使うことができるので汎用性がたかく、非常に便利なのです。

(totalcount 100,985 回, dailycount 537回 , overallcount 13,931,148 回)

ライター:

統計学の基礎

single-banner

COMMENT

コメントを残す

メールアドレスが公開されることはありません。
*は必須項目です。




CAPTCHA


  • su 2018.4.25 6:11 PM

    例題の答え合ってますか?
    手元で計算したら

    $\frac{653318623488084065789005989366897230712647273602379087792875818784707960241055}{653318623500070906096690267158057820537143710472954871543071966369497141477376}$
    で、およそ 0.999999999981652 となりました。

    $\sqrt{\frac{3500}{12}}$ が 59.16 というのがよく分かりません。

  • y0he1 2018.5.21 9:07 AM

    コメントありがとうございます。

    おっしゃる通りで
    \sqrt{\frac{3500}{12}}$ を 59.16
    と計算したことにより回答が間違っていました。

    これだと確率が小さくなりすぎるため、例題の数値を少し変更し、回答を訂正さていただきました。

  • su 2018.4.25 6:11 PM

    例題の答え合ってますか?
    手元で計算したら

    $\frac{653318623488084065789005989366897230712647273602379087792875818784707960241055}{653318623500070906096690267158057820537143710472954871543071966369497141477376}$
    で、およそ 0.999999999981652 となりました。

    $\sqrt{\frac{3500}{12}}$ が 59.16 というのがよく分かりません。

  • y0he1 2018.5.21 9:07 AM

    コメントありがとうございます。

    おっしゃる通りで
    \sqrt{\frac{3500}{12}}$ を 59.16
    と計算したことにより回答が間違っていました。

    これだと確率が小さくなりすぎるため、例題の数値を少し変更し、回答を訂正さていただきました。