2016/08/15
2021/09/29
標準偏差の意味と求め方
標準偏差とは?
標準偏差とは、分散を平方根にとることによって計算される値です。文字式では、分散の文字式から2乗を取って、\(s\)や \(σ\)などと表されます。分散について詳しくは、分散の基礎知識と求め方をご覧ください。
標準偏差を求める公式
標準偏差(標本標準偏差)\(s\) は分散(標本分散)\(s^2\) を使って以下のように表されます。
$$ s = \sqrt{s^2}$$
また、\(n\)個の観測値 \(x_1,x_2…x_n\) とその標本平均\(\overline{x}\)を用いて次のように表されることもあります。
$$s = \sqrt{\frac{1}{n}\displaystyle \sum_{ i = 1 }^{ n } (x_i-\overline{x})^2}$$
計算例
Aさん,Bさん,Cさん,Dさん,Eさんのテストの数学の得点がそれぞれ以下のようになりました。
名前 | 得点 |
---|---|
Aさん | 90点 |
Bさん | 80点 |
Cさん | 40点 |
Dさん | 60点 |
Eさん | 90点 |
この場合、平均点は72点であり、また分散は、
となります。標準偏差というのはこの分散の平方根によって計算される値であるので、
$$ \sqrt{376} ≒ 19.39071 $$
となります。
なぜ標準偏差を求めるのか?
分散は、計算過程において2乗しているので観測データの単位と異なります。例えば観測データの単位が \(g(グラム)\) である場合、分散の単位は \(g^2\) になります。そこで、分散の平方根である標準偏差を求めることによって、観測データとの単位を揃えることが出来ます。そうすることで、分散よりも扱いやすい値となります。
例えば、先ほどのAさん~Eさんのテストの例においても、分散が376であると言われてもピンときません。しかし、標準偏差が約19.3であることから、”平均点±19.3点の中に大体の人がいる”というような認識を持つことが出来ます。
右図は正規分布のグラフにおける、標準偏差\(σ,2σ,3σ\)が示す範囲を指しています。図のように、正規分布の場合、平均値±標準偏差中に観測データが含まれる確率は68.3%になります。これが±標準偏差の2倍、3倍になるとさらに確率は上がります。
範囲 | 範囲内に指定の数値が現れる確率 |
---|---|
平均値±標準偏差 | 68.3% |
平均値±(標準偏差×2) | 95.4% |
平均値±(標準偏差×3) | 99.7% |
特に、平均±3σという範囲は、企業の商品製造の規格として広く採用されています。
(正規分布についてさらに詳しく知りたい方はこちらをご覧ください。)
不偏標準偏差について
母標準偏差の推定値である、不偏標準偏差\(S\)は不偏分散の平方根を取ることによって計算されます。つまり、以下の式のようになります。\(\bar{x}\)は標本平均。
$$S = \sqrt{\frac{1}{n-1}\displaystyle \sum_{ i = 1 }^{ n } (x_i-\overline{x})^2}$$
不偏推定量について、詳しくは平均と分散の不偏推定量はどうなるのか?をご覧ください。
偏差値の計算にも標準偏差が使われている
標準偏差は身近でもよく用いられています。例えば、中学や高校の模擬試験の出来を判断する指標である”偏差値”というのも、標準偏差を用いて、下記の式で算出されています。
$$偏差値=\frac{(得点ー平均点)}{標準偏差} \ \ \ \ \ ×10+50$$
この式は、正規分布に従うと仮定した得点を標準化した結果を10倍して、50足すというようなものになっています。
偏差値について詳しくは→偏差値の意味、求め方、性質などのまとめ
正規分布の標準化について詳しくは→正規分布を標準化する方法と意味と例題と証明
Recommended