正規分布の公式と特徴まとめ

2024.3.04

2024.3.28

正規分布

正規分布（ガウス分布）に関するあらゆる特徴を、分かりやすくまとめました。目次から気になるトピックをご覧ください。

また正規分布の関連記事はこちらからご確認ください。

正規分布（ガウス分布）とは
正規分布の基本的な性質
確率密度関数
正規分布が持つ3つの性質
標準正規分布
標本平均の分布と正規分布の関係
1. 中心極限定理
正規分布と標準偏差の関係
正規分布の積率母関数
確率密度関数から正規分布の期待値・分散の導出
1. 期待値（平均）の導出
2. 分散の導出
指数型分布族の性質を利用した正規分布の期待値・分散の導出
1. 期待値の導出
2. 分散の導出
正規分布の事後分布の平均・分散
正規分布と他の確率分布との関係
関連記事

正規分布（ガウス分布）とは

正規分布とは、統計学を理解する上で最も大切な確率分布の一つです。

正規分布はガウス分布と呼ばれることもしばしばあります。これは18世紀から19世紀に渡って活躍した数学者C.F.ガウスに由来します。ガウスは天文学の観測データの研究から測定誤差がある法則に従うことを導き出し、誤差理論を確立しました。これが正規分布の基礎となったと言われています。

正規分布の基本的な性質

正規分布には以下のような基本的な性質があります。

平均値と最頻値と中央値が一致する。
平均値を中心にして左右対称である。（直線x=μに関して対称）
x軸が漸近線である。
分散（標準偏差）が大きくなると、曲線の山は低くなり、左右に広がって平らになる。分散（標準偏差）が小さくなると、山は高くなり、より尖った形になる。

確率密度関数

一変量の確率変数 $X$ が、平均 $μ$ 、分散 $σ^2$ の正規分布に従うとき、確率密度関数は次の式で表されます。

$f(x) = \frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]}$

この確率密度関数を全区間で、積分すると1になります。また正規分布が平均 $μ$ ,分散 $σ^2$ に従うことを省略して $N(μ,σ^2)$ に従うと表記することもあります。

この $N$ は正規分布 Normal distribution の頭文字から来ています。

正規分布が持つ3つの性質

正規分布には、以下3つの性質があります。各性質の詳細の説明や証明は、「正規分布の3つの性質とその証明」をご確認ください。

性質1：確率変数aX+bが従う正規分布

確率変数 $X$ が正規分布 $N(μ,σ^2)$ に従うとき、 $aX+b$ は正規分布 $N(aμ+b,a^2σ^2)$ に従う。

性質2：標準化による標準正規分布

性質１を用いて、 $Z = \frac{X-μ}{σ}$ と変換すると、 $Z$ は平均0、分散1の正規分布に従う。これを特別に標準正規分布という。

また、この変換を正規分布の標準化と呼ぶ。

性質3：正規分布の再現性

確率変数 $X$ と $Y$ が独立に正規分布 $N(μ_1,σ_1^2)$ , $N(μ_2,σ_2^2)$ にそれぞれ従うとき、 $X+Y$ も正規分布に従う。

また、その分布は $N(μ_1+μ_2,σ_1^2+σ_2^2)$ となる。

標準正規分布

確率変数 $X$ が正規分布 $N(μ,σ^2)$ に従うとき、 $X$ の線形変換 $Z = \frac{X-μ}{σ}$ は $N(0,1)$ に従います。

この平均0、分散1の分布を標準正規分布と言います。また、 $Z$ の確率密度関数は次のようになります。

$f(z) = \frac{1}{\sqrt{2π}}e^{-\frac{z^2}{2}}$

全ての正規分布はこの変換によって、標準正規分布に変換することができます。この変換を、正規分布の標準化といいます。

また、標準正規分布に従う確率変数 $Z$ に対して、確率　 $P(u≦Z≦∞)$ を $P(u)$ としたとき、様々な $u$ に対する確率をまとめたものが、標準正規分布表といいます。

標本平均の分布と正規分布の関係

正規分布と標本平均には次のような関係があります。

母平均 $μ$ 、母分散 $σ^2$ の母集団から大きさ $n$ の標本を無作為に抽出するとき、標本平均 $\bar{X}$ は、 $n$ が大きい場合、 $N(μ,\frac{σ^2}{n})$ に近似的に従う。

正規分布が統計学を理解する上で非常に大事である理由の一つがこの特徴によるものです。この特徴を中心極限定理と言います。

抽出元の母集団の分布がどのような分布に従っていても、 $n$ が大きければ、その標本平均の分布は正規分布に従うのです。二項分布でも、ポアソン分布でも、指数分布でも、あるいは未知の分布だとしても、その標本平均の分布は正規分布に従います。（ $n → ∞$ ならば完全に従う）

さらに、もし母集団分布が正規分布であった場合、標本平均 $\bar{X}$ は $n$ の大きさによらず、正規分布 $N(μ,\frac{σ^2}{n})$ に従います。

中心極限定理

中心極限定理の定義は以下です。

平均 $\mu$ 、分散 $\sigma^2$ をもつあらゆる分布からの無作為標本の標本平均 $X$ の分布はnが十分大きいとき以下の式が成立する。
$\lim_{n \to \infty} P(Z_{n} \leq z)=\Phi(z)=\int_\infty^z \frac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^2}{2}} dx$

これは、「確率変数の数が多くなったとき、あらゆる同一の分布に従う確率変数の標本平均の分布が、元の分布に関係なく、正規分布に収束する」という定理です。この定理の存在よって、正規分布があらゆる場面で使える分布となっています。

正規分布と標準偏差の関係

正規分布の標準偏差 $σ$ （シグマ）は、その分布を把握する上でよく使われる指標です。

上図が正規分布のグラフと、標準偏差とその2倍、3倍 $σ,2σ,3σ$ の範囲を示したものです。

図からみてわかる通り、平均や分散、標準偏差の値とは関係なく、全ての正規分布のグラフは以下の性質を示します。

平均値±1σの範囲中に、全体の約68パーセント（偏差値で言うと40〜60）
平均値±2σ（場合によっては1.96σ）の範囲中に、全体の約95パーセント（偏差値で言うと30〜70）
平均値±3σの中に、全体の約99.7パーセント（偏差値でいうと20~80）

正規分布の積率母関数

正規分布の積率母関数は以下のように導出されます。

$\begin{equation*}\begin{split}m_X(t)&=E(\mathrm{e}^{tX})\\ &=\displaystyle \int_{ - \infty }^{ \infty }\mathrm{e}^{tx}f(x)dx\\&={\mathrm{e}}^{\mu t＋\frac{{\sigma}^{2}t^2}{2}}\end{split}\end{equation*}$

上式の積率母関数を使った正規分布の平均や分散の導出の詳細は、「積率母関数を用いた正規分布の期待値（平均）と分散の導出」をご確認ください。

確率密度関数から正規分布の期待値・分散の導出

確率密度関数から、正規分布の期待・分散を導出してみます。詳細は「確率密度関数を用いた正規分布の期待値（平均）と分散の導出」をご確認ください。

期待値（平均）の導出

$\begin{equation*}\begin{split}E(X)&=\displaystyle \int_{ - \infty }^{ \infty } xf(x) dx\\&=\displaystyle \int_{ - \infty }^{ \infty } (x-\mu+\mu)f(x) dx\\ &=\displaystyle \int_{ - \infty }^{ \infty } (x-\mu)\frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]}dx+\mu f(x) dx\\&=μ\end{split}\end{equation*}$

分散の導出

$\begin{equation*}\begin{split}E(X^2)&=\displaystyle \int_{ - \infty }^{ \infty } x^2f(x) dx\\&=\displaystyle \int_{ - \infty }^{ \infty }\{{(x-\mu)}^2+2\mu x-{\mu}^2\}\frac{1}{\sqrt{2\pi σ^2}}\mathrm{e}^{-\frac{{(x-\mu)}^2}{2σ^2}}dx\\&=\displaystyle \int_{ - \infty }^{ \infty }{(x-\mu)}^2\frac{1}{\sqrt{2\pi σ^2}}\mathrm{e}^{-\frac{{(x-\mu)}^2}{2σ^2}}dx+{\mu}^2\\&=σ^2\displaystyle \int_{ - \infty }^{ \infty }\frac{1}{\sqrt{2\pi }}\mathrm{e}^{-\frac{y^2}{2}}dy+{\mu }^2\\ &=σ^2+\mu^2\\\\ V(X)&=E(X^2)-{(E(X))}^{2}\\ &={\sigma}^{2} \end{split}\end{equation*}$

指数型分布族の性質を利用した正規分布の期待値・分散の導出

正規分布は指数型分布族に属します。指数型分布族に属することの証明は「正規分布が指数型分布族に属することの証明」をご確認ください。

指数型分布族の性質を利用した正規分布の期待値と分散の導出は以下の通りです。

指数型分布族に関する説明は「指数型分布族とは？定義と性質をわかりやすく解説」、指数型分布族の性質を用いた期待値・分散の導出の詳細は「指数型分布族の性質を利用した期待値と分散の求め方」をそれぞれご確認ください。

期待値の導出

$E(X) = E[a(X)] = -\frac{c'(\mu)}{b'(\mu)} = -\frac{\frac{1}{\sigma^2}}{\left(\frac{\mu}{\sigma^2}\right)} = \mu$

分散の導出

$Var(X) = Var[a(X)] = \frac{b''(\theta)c'(\theta) - c''(\theta)b'(\theta)}{[b'(\theta)]^3} = \frac{0 \cdot \left(-\frac{1}{\sigma^2}\right) - \left(-\frac{1}{\sigma^2}\right) \cdot \left(\frac{1}{\sigma^2}\right)}{\left[ \frac{1}{\sigma^2} \right]^3} =\sigma^2$

正規分布の事後分布の平均・分散

正規分布に従う母集団からデータを取ってくるとき、共役事前分布は正規分布となります。

よって、事前分布を正規分布としたとき、事後分布は次のようなことが言えます。

母平均 $\mu$ 、母分散 $\sigma^2$ に従う正規母集団から大きさ $n$ の標本を抽出し、標本平均 $\overline{x}$ を得たとする。母平均 $\mu$ の事前分布として平均 $\eta$ 、分散 $\tau^2$ の正規分布をとるとき、 $\mu$ の事後分布は
平均： $\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2}=\frac{\frac{n}{\sigma^2}\overline{x}+\frac{1}{\tau^2}\eta}{\frac{n}{\sigma^2}+\frac{1}{\tau^2}}$
分散： $\frac{\tau^2\sigma^2}{n\tau^2+\sigma^2}=\frac{\frac{\sigma^2\tau^2}{n}}{\frac{\sigma^2}{n}+\tau^2}$
の正規分布に従う