2016/09/07
2020/04/14
正規分布の密度関数を意味的に理解する
$$f(x) = \frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]}$$
上記は正規分布の確率密度関数の式ですが、なぜこのように長くて難しい式なのでしょうか。
中々覚えにくい式なので、丸暗記するのではなく、式の意味を理解しておきたいところです。そうすれば、試験場で忘れる心配もありません。ですので今回は、この式を意味的な導出過程とともに見ていきましょう。
正規分布の密度関数の式はこうして作られた!
まず、世の中の多くの事象は平均値を取る確率が一番大きく、平均値から離れるにつれその値を取る確率は小さくなることが知られています。
このような現象を簡単に表せる関数を見つけ、それが
$$f(x)=\mathrm{e}^{-x^2}$$
でした。
しかし、この式には任意定数が含まれていませんので、グラフもただ一通りしか書けず汎用性に欠けます。そこで、任意定数を式に加える必要がありました。
必要なのは、山のてっぺん(平均)が任意の値を取れるようにすること。グラフの幅を自由自在に決められることです。
平均の値を変えるにはこのグラフを左右に動かす必要があります。そのため、式は
$$f(x)=\mathrm{e}^{-{(x-μ)}^2}$$
とします。このようにするとμの値によって左右にグラフを平行移動させることが出来ます。
次に、グラフの幅を変えたい。そこで、
\(f(X)=\mathrm{e}^{-\frac{{(x-μ)}^2}{2{σ}^2}}\)
と変形してみます。すると、σの値が小さくなれば幅は縮まり、大きくなれば幅は広がるようなグラフになりました。
\(σ\)の値によらず、常に正の値を取るようにするために、二乗値の\(σ^2\)としています。また、係数2がついているのは後の計算結果がきれいになるからです。
ここまで来れば、あと一歩で完成です。
密度関数は全区間の確率点の和が1になる必要があります。そこで式の先頭に定数をつけて調整します。
$$\displaystyle \int_{ – \infty }^{ \infty } c\mathrm{e}^{-\frac{{(x-μ)}^2}{2{σ}^2}}dx=1$$
となる定数cを計算します。すると
$$c= \frac{1}{\sqrt{2πσ^2}}$$
が得られます。
これにより、正規分布の確率密度関数は
$$f(x) = \frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]}$$
となります。
Recommended