2016/09/05
2020/04/14
正規分布を標準化する方法と意味と例題と証明
正規分布を標準正規分布に変形することを、標準化といいます。
(正規分布について詳しく知りたい方は正規分布とは?をご覧ください。)
正規分布を標準化する式
確率変数\(X\)が正規分布\(N(μ,σ^2)\)に従うとき、
$$ Z = \frac{X-μ}{σ} $$
と変換すると、\(Z\)は標準正規分布\(N(0,1)\)(平均0,分散1)に従います。
標準正規分布の確率密度関数
$$ f(X) = \frac{1}{\sqrt{2π}}e^{-\frac{x^2}{2}}$$
正規分布を標準化する意味
標準正規分布表をご存知でしょうか?下図のようなものです。何かとよく使うこの表ですが、すべての正規分布に対して用意するのは大変です(というか無理です)。そこで、他の正規分布に関しては標準化によって標準正規分布に直してから、標準正規分布表を使います。
正規分布というのは、実数倍や平行移動を同じものと考えると、一種類しかありません。なので、どの正規分布も標準化によって、標準正規分布に変換できます。そういうわけで、表も標準正規分布表一つで十分なのです。
標準化を使った例題
とある大学の男子について身長を調査したところ、平均身長170cm、標準偏差7の正規分布に従うことが分かった。では、身長165cm~175cmの人の数は全体の何%占めるか?
解説
この問題を標準化によって解く。身長の確率変数をXと置く。平均170、標準偏差7なので、Xを標準化すると、
$$ Z = \frac{X-170}{7} $$
となる。よって
\begin{eqnarray}165≦X≦175 &⇔& \frac{165-170}{7}≦Z≦\frac{175-170}{7}\\\\&⇔&-0.71≦Z≦0.71\end{eqnarray}
であるので、標準正規分布が-0.71~0.71の値を取る確率が答えとなる。
これは標準正規分布表より、0.5223と分かるので、身長165cm~175cmの人の数は全体の52.23%である。
ちなみに、この例題では身長が正規分布に従うと仮定していますが、身長が本当に正規分布に従うかの検証を、【例】身長の分布は本当に正規分布に従うのか!?で行なっております。興味のある方はお読みください。
標準化の証明
初めに標準化の式について触れましたが、どうしてこのような式になるのか、証明していきます。
証明
正規分布の性質を利用する。
確率変数\(X\)が正規分布\(N(μ,σ^2)\)に従うとき、\(aX+b\)は正規分布\(N(aμ+b,a^2σ^2)\)に従う。
性質1において\(a = \frac{1}{σ}, b= -\frac{μ}{σ}\)とおけば、
$$ N(aμ+b,a^2σ^2) = N(0,1) $$
となるので、これは標準正規分布に従う。また、このとき
$$ aX+b = \frac{X-μ}{σ} $$
となる。よって
$$ Z = \frac{X-μ}{σ} $$
は標準正規分布に従う。
まとめ
正規分布を標準正規分布に変換する標準化についていかがでしたでしょうか。証明を覚える必要まではありませんが、標準化の式は使えるようにしておきたいところです。
余力のある人は是非証明を自分でやってみて、理解を深めて見てください!
また、正規分布についてさらに詳しく知りたい方はこちらをご覧ください。
COMMENT
-
nonono 2017.10.13 5:40 AM
>標準正規分布が-0.714~0.714の値を取る確率が答えとなる。これは標準正規分布表より、0.5407と分かるので、身長165cm~175cmの人の数は全体の54.07%である。
0.5407は標準正規分布表に記載ないのですがどのように導くのでしょうか?ズブの素人質問ですが宜しくお願い致します。
-
IMIN 2017.10.13 6:08 PM
コメントありがとうございます。
まず、元の 0.5407 という数値に誤りがあり、正しくは、 0.5223 だったので訂正させて頂きました。また当サイトに掲載している標準正規分布表が少数第2位までのものでしたので、0.714→0.71 に変更いたしました。大変申し訳ございません。この変更を前提として質問に答えさせていただきます。
まず、今回求めたいのは-0.71〜0.71の間の確率です。しかし当サイトの標準正規分布表は上側確率の表なので、○○以上の確率は見つけられても、○○〜△△の間の確率は見つけることは出来ません。そこで標準正規分布のグラフがy軸対象であることと、全確率の和が1になることを利用して、-0.71〜0.71 の間をとる確率を求めます。0.71以上となる確率は、表より、0.23885なので、-0.71以下となる確率はグラフの対称性により同じく0.23885となります。そして全確率の和は1なので、-0.71〜0.71間の確率は、1から0.71以上の確率と-0.71以下の確率を引けば良い、と言うことになります。よって、
1-(0.23885+0.23885) = 0.5223
が求められます。
nonono 2017.10.13 5:40 AM
>標準正規分布が-0.714~0.714の値を取る確率が答えとなる。これは標準正規分布表より、0.5407と分かるので、身長165cm~175cmの人の数は全体の54.07%である。
0.5407は標準正規分布表に記載ないのですがどのように導くのでしょうか?ズブの素人質問ですが宜しくお願い致します。
IMIN 2017.10.13 6:08 PM
コメントありがとうございます。
まず、元の 0.5407 という数値に誤りがあり、正しくは、 0.5223 だったので訂正させて頂きました。また当サイトに掲載している標準正規分布表が少数第2位までのものでしたので、0.714→0.71 に変更いたしました。大変申し訳ございません。
この変更を前提として質問に答えさせていただきます。
まず、今回求めたいのは-0.71〜0.71の間の確率です。しかし当サイトの標準正規分布表は上側確率の表なので、○○以上の確率は見つけられても、○○〜△△の間の確率は見つけることは出来ません。そこで標準正規分布のグラフがy軸対象であることと、全確率の和が1になることを利用して、-0.71〜0.71 の間をとる確率を求めます。
0.71以上となる確率は、表より、0.23885なので、-0.71以下となる確率はグラフの対称性により同じく0.23885となります。そして全確率の和は1なので、-0.71〜0.71間の確率は、1から0.71以上の確率と-0.71以下の確率を引けば良い、と言うことになります。よって、
1-(0.23885+0.23885) = 0.5223
が求められます。