2016/08/22
2020/04/14
記述統計学と推計統計学の違い
ひとえに統計学といっても、その中にもさまざまな種類があります。そして、特に代表的なものは、次の3種類に大別出来ます。
1.記述統計学
2.推計統計学
3.ベイズ統計学
今回はこのうち、記述統計学と推計統計学の違いに着目しつつ、それぞれの特徴について触れていきたいと思います。
目次
記述統計学(descriptive statistics)の概要とその限界
ではまず、記述統計学から見ていきましょう。記述統計学は、推計統計学よりも先に生まれた学問です。
記述統計学では、
「あるデータに対して、そのデータの特徴をより簡単にわかりやすく表現する」
といったことを行います。
○○の平均は記述統計学の一種
テストの平均点やクラスの平均身長などは記述統計学を使っています。
例えば、とあるテストの出来具合を1組と2組で比較したい場合、生徒の点数を並べただけではわかりづらくて比較が出来ません。そこで平均点という指標によって、容易に比較できるようになります。
「分かりにくいデータを、分かりやすく変換する」
ということが記述統計学の目指すものです。
データをグラフや表にすることも記述統計学
「データを分かりやすくする」という意味では、グラフや表を作成すること、作成されたグラフや表からから様々な特徴を抽出することも、記述統計学に分類されます。例えば、ある会社の社員20人の身長データが得られたとき、下図のようなバラバラの状態では分かりにくいですよね。
これでは、データの特徴を捉えるのは難しいです。そこで、このようにグラフで表現します。
すると、だいぶ分かりやすくなりますよね。「167~177cmの人が一番多い」などという情報も一目瞭然です。ちなみにこのように、横軸に範囲指定された値(階級とも言う)を取る棒グラフを、特別にヒストグラムなどと呼んだりもします。
記述統計学の限界とその例
さて、データの表現手法として有用な記述統計学ですが、その一方で弱点もあります。というのも、記述統計学では、分析できないことがたくさんあるのです。
ここで、記述統計学では、たちうち出来ない2つの例を挙げてみましょう。
「日本人全体の平均年収について統計したい。」
この場合、全国民にアンケート調査をとり、年収を答えてもらう必要があります。ですが、こんなことは現実的に不可能ですよね。よって、全国民の年収データを作ることは出来ません。データがない以上、記述統計学を用いても、日本人全体の年収について統計を作れないのです。
「今回の模試の結果から本番の入試の点数を推測したい。」
この場合は本番の入試というのは未来のことであるので、データが入手不可能です。これまた、データがないので記述統計学では、推測することができないのです。
2つの例でお分かりいただけたかと思いますが、記述統計学というのはつまり、データがないと何もできないのです。データを分かりやすく表現するという学問なので、当たり前と言えば当たり前ですが。これが記述統計学の限界となります。
この弱点を克服したのが、推計統計学という考え方です。
推計統計学(inferential statistics)
推計統計学とは、限られた標本から調査したい母集団全体の特徴を推測するという学問です。別名、推測統計学、推計学などとも言います。この推計統計学が登場した後、記述統計学は古典統計学と称されるようになりました。
推計統計学の考え方
推計統計学では、集められたデータは大きな母集団の中の小さな標本に過ぎないと考えます。そして、下図のように母集団を推測しようとします。
先ほど説明した、記述統計学では母集団と標本の区別をしていませんでした。(ほとんどの場合、母集団=標本)そのため、統計できる範囲は標本にとどまります。
これでは、標本に取れないものを扱うことが出来ません。推計統計学はその点を克服した考え方です。
推計統計学の活用例
ここに推計統計学の活用例を挙げます。せっかくなので、先ほどの記述統計学では扱いきれなかった2例について、推計統計学で扱ってみましょう。詳しい話は専門知識が必要になるので、ここでは触りだけにとどめておきます。
日本人全体の平均年収について統計したい
今回の模試の結果から本番の入試の点数を推測したい
解説)この場合は、今まで(去年以前)の人たちのその模試と本番入試の点数の関係を利用します。例えば、それは回帰分析と呼ばれる手法が使えたります。
詳しい説明は避けましたが、「推計統計学を使えば、こんなことが出来るんだよ」という理解を持って頂ければと思います。
ここで紹介したのはあくまで一例であり、同じ問題に対しても、推測の仕方はまた別にあったりもします。が、今回はこの辺にしておきましょう。
そして、推計統計学には大きく2種類に細分されます。”統計的推定”と”仮説検定”です。これについては、それぞれ別ページにまとめてあるのでそちらも併せてお読みいただければと思います。
→統計的推定とは?~点推定と区間推定の違い~
→仮説検定とは?初心者にもわかりやすく解説!
まとめ
いかがでしたでしょうか。専門性の高い内容は避けながらの説明になりましたが、記述統計学と推計統計学の違いはお分かりいただけたと思います。
もう一度おさらいすると、
記述統計学は標本についてのみ考えます。(標本と母集団を同一視して考えます)
対して、
推計統計学では標本は大きな母集団のうちの部分集合であり、標本はあくまで母集団について考える材料に過ぎません。
そして、記述統計学の問題点を推計統計学が解決してくれるということです。
また、記述統計学や、推計統計学の誕生の経緯についてさらに詳しく知りたい方は、統計学の歴史〜古代ローマから現代まで〜でまとめているので是非お読みください。
Recommended