2017/06/25

2020/04/21

ベイズ統計学の考え方〜ベイズ論と頻度論の違い〜

ベイズ統計

ライター:

ベイズ統計といえば、事前分布、事後分布、ベイズリスク・・・という言葉を連想する方もいらっしゃると思いますが、ここでは、ベイズ統計の中でも、特に基本的な考え方についてご説明いたします。

・ベイズ統計学のトップページはこちら⇨ベイズ統計学のわかりやすいまとめ
・ベイズ統計の超基本的な解説はこちら⇨ベイズ統計学とは?初心者向けのやさしい解説

頻度論の考え方(非ベイズ的な考え方)

ベイズ統計の解釈について考えるためには、まず頻度論の考え方を理解しなければなりません。頻度論とは、得られたデータが母集団からどれくらいの頻度(確率)で発生するのか、ということを基本的な考え方とする理論です。おそらくみなさんが学習するほとんどの統計手法は、この頻度論の考えたかに基づいているかと思います。

例えば、頻度論における仮説検定では、「パラメータに関する帰無仮説を立て、得られたデータがまれに発生したのかどうか判断する」、ということをしますが、それはつまり母集団を帰無仮説の下で固定した時に、得られたデータが発生した確率を吟味し、妥当かどうかを判断するということです。ここで重要なのは、パラメータを固定し、データが動くということです。これを数学的に言い換えますと、パラメータが定数、データが変数(確率変数)ということになり、そのような統計学を、頻度論と言います。

ベイズ論の考え方

ここまで言えばもうわかる人もいるかもしれませんが、上記の頻度論の考え方に対し、ベイズ論の考え方は、全くの逆です。つまり、パラメータが変数(確率変数)、データが定数となります。つまりデータを固定した上で、パラメータを動かすということになります。言い換えると、いま手元にあるデータが、どのようなパラメータに基づく母集団から得られたのか、を考えるということです。

話をわかりやすくするために、例を用いて考えることにしましょう。

男性の身長について考えまる。いま男性の身長の母集団分布が平均\(\mu\)(未知パラメータ)、分散\(10^2\)の正規分布に従っていて、そこから\(30\)人調査して標本平均\(177\)cmを得たとする。

このとき頻度論では、母平均が\(\mu\)(未知だが、実際に存在する値=定数)である母集団に対し、得られたデータ\(177\)cmがどのくらいの確率で得られるか、さらには得られたデータから母平均を推測、検定・・・ということを考えます。

対してベイズ論では、\(177\)cmというデータが、どのような(母平均が\(\mu\)である)母集団から得られる確率が高いか、ということを考えます。例えば、母平均が\(177\)cmである母集団からデータ\(177\)cmが得られる確率は高いですが、母平均が\(165\)cmである母集団からデータ\(177\)cmが得られる確率は低くなります。このように、母平均\(\mu\)を動かして考える、つまり、パラメータ\(\mu\)を変数として考えるのがベイズ論の考え方です。

ベイズ統計ではパラメータ\(\mu\)は確率変数ですから、分布を持ちます。上記の例でいうと、パラメータ\(\mu\)が\(177\)cmであるとき、標本平均\(177\)cmというデータを得られる確率が最も高いので、平均を\(177\)とし、分散\(\sigma^2\)の正規分布に従うとすると、\(\mu 〜N(177,\sigma^2)\)と表記することができます。これは、頻度論では見慣れない書き方ですね。

補足:上記の例では\(177\)cmは頻度論における最尤推定量になります。ベイズ統計では上記の例に事前情報を考慮するので、実際には\(\mu\)の平均は最尤推定量と一致しないことがほとんどです(参考:『ベイズ推定と最尤推定の違いを例題を用いて解説』)。

頻度論とベイズ論、どっちがいい?

さてこれら二つの理論、結局どちらの考え方の方が優れているのでしょうか。もちろん、いずれも上記だけでは説明不足なので、長所を全て書くことはできませんが、大体次のようなことが言えます。

・頻度論
現実世界では母集団のパラメータは真に決まっているし、データもどこから取ってくるかで変わる。つまり、世の中的に正しい考え方。

・ベイズ論
世の中的には正しい考えではないが、結局母集団のパラメータはわからないし、いま手元にあるのはデータだけである。だったらいまある情報だけで母集団を考えよう、という合理的な考え方。

 

このように、どちらにも長所があり、どちらが良いとか、一概に言うことは出来ません。大切なのは、両方の理論を知り、推測手法の幅を広げて行くことでしょう。

 

参考記事

・ベイズ統計学のトップページはこちら⇨ベイズ統計学のわかりやすいまとめ

・ベイズ統計の超基本的な解説はこちら→ベイズ統計学とは?初心者向けのやさしい解説

・最尤推定量に関する説明はこちら→最尤推定量とは?初めての人にもわかる解説

・最尤推定とベイズ推定の違いはこちら→ベイズ推定と最尤推定の違いを例題を用いて解説

(totalcount 34,125 回, dailycount 112回 , overallcount 15,134,011 回)

ライター:

ベイズ統計

single-banner

COMMENT

コメントを残す

メールアドレスが公開されることはありません。
*は必須項目です。




CAPTCHA