2016/09/07
2020/04/14
正規分布の密度関数を意味的に理解する
$$f(x) = \frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]}$$
上記は正規分布の確率密度関数の式ですが、なぜこのように長くて難しい式なのでしょうか。
中々覚えにくい式なので、丸暗記するのではなく、式の意味を理解しておきたいところです。そうすれば、試験場で忘れる心配もありません。ですので今回は、この式を意味的な導出過程とともに見ていきましょう。
正規分布の密度関数の式はこうして作られた!
まず、世の中の多くの事象は平均値を取る確率が一番大きく、平均値から離れるにつれその値を取る確率は小さくなることが知られています。
このような現象を簡単に表せる関数を見つけ、それが
$$f(x)=\mathrm{e}^{-x^2}$$
でした。
しかし、この式には任意定数が含まれていませんので、グラフもただ一通りしか書けず汎用性に欠けます。そこで、任意定数を式に加える必要がありました。
必要なのは、山のてっぺん(平均)が任意の値を取れるようにすること。グラフの幅を自由自在に決められることです。
平均の値を変えるにはこのグラフを左右に動かす必要があります。そのため、式は
$$f(x)=\mathrm{e}^{-{(x-μ)}^2}$$
とします。このようにするとμの値によって左右にグラフを平行移動させることが出来ます。
次に、グラフの幅を変えたい。そこで、
\(f(X)=\mathrm{e}^{-\frac{{(x-μ)}^2}{2{σ}^2}}\)
と変形してみます。すると、σの値が小さくなれば幅は縮まり、大きくなれば幅は広がるようなグラフになりました。
\(σ\)の値によらず、常に正の値を取るようにするために、二乗値の\(σ^2\)としています。また、係数2がついているのは後の計算結果がきれいになるからです。
ここまで来れば、あと一歩で完成です。
密度関数は全区間の確率点の和が1になる必要があります。そこで式の先頭に定数をつけて調整します。
$$\displaystyle \int_{ – \infty }^{ \infty } c\mathrm{e}^{-\frac{{(x-μ)}^2}{2{σ}^2}}dx=1$$
となる定数cを計算します。すると
$$c= \frac{1}{\sqrt{2πσ^2}}$$
が得られます。
これにより、正規分布の確率密度関数は
$$f(x) = \frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]}$$
となります。
最新投稿記事
-
AIプロジェクトの企画と失敗しない進め方を解説 2021年1月19日
-
AVILEN人材育成コース受講体験談:山田裕之さん「E資格の”その先”を目指して」 2021年1月8日
-
AI導入とは?RPAとの関係、プロセス、事例、メリット、費用を詳細に解説 2020年12月7日
-
注目のAI開発企業11社!支援領域や提供方法など検証! 2020年10月28日
-
AI人材を育成できる研修プログラムを一挙紹介! 2020年10月20日
-
【2021年版】期待のAI資格11選!就職・転職にも使える! 2020年10月18日
-
JDLAとは?G検定、E資格の認定プログラム、合格者の会など紹介! 2020年10月14日
-
G検定(2020#3)受験申し込み開始、11月7日(土)実施-JDLA 2020年10月1日
-
【独占】コロナ禍で人材登録急増、アノテーション単月売上高は4倍超-パソナJOB HUB 2020年10月1日
-
E資格を転職に活用!評判とデータを徹底調査! 2020年9月29日
週間ランキング
【2021年版】コスパ重視のG検定対策!おすすめの本・講座・教材を一挙紹介! 2020年6月6日
G検定に短期間・独学で合格した勉強法を解説! 2020年8月3日
【2021年版】期待のAI資格11選!就職・転職にも使える! 2020年10月18日
G検定は難しい?難易度・合格ライン・問題を徹底解説! 2020年6月19日
注目のAI開発企業11社!支援領域や提供方法など検証! 2020年10月28日
G検定に落ちた人、合格した人。勉強法の違いはどこにある? 2020年6月25日
最弱オセロを初めて攻略した天才オセロ高校生。負け方を解説! 2020年7月31日
【2021年版】E資格とは?大注目のディープラーニングの資格を解説! 2020年9月29日
E資格の難易度を、合格率と問題から徹底分析! 2020年8月11日
MLOpsとは|定義、メリット、課題、ツール、ワークフローを分かりやすく解説 2020年9月18日
