2017/10/10
2020/04/14
ベイズ統計の仮説検定〜頻度論との違い〜【第1回】
ベイズ統計にも、頻度論と同じように仮説検定が存在します。頻度論における仮説検定は、ネイマン-ピアソンの基本定理に基づいて行われますが、ベイズ統計では、それとは違った考え方やアプローチで仮説検定を行います。それらのことを詳しく解説していきます。
ベイズ統計の仮説検定は全6回にわたって説明しています。他のページもぜひご覧ください。
【第1回】ベイズ統計の仮説検定〜頻度論との違い〜 ←イマココ!
【第2回】ベイズ統計の仮説検定〜基本的な検定〜
【第3回】ベイズ統計の仮説検定〜頻度論の考え方に基づく検定〜
【第4回】ベイズ統計の仮説検定〜ベイズファクター〜
【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜
【第6回】ベイズ統計の仮説検定〜問題点とまとめ〜
頻度論における仮説検定の考え方
まず最初に、頻度論における仮説検定を説明します。
(仮説検定の基本的な解説はこちら→『仮説検定とは?初心者にもわかりやすく解説!』)
頻度論の最も基本的な前提条件は、
・母集団の未知パラメータを定数
・データを変数
として扱います。
例えば、日本人男性の平均身長について、
$$H_0:\mu=172$$
という仮説検定を考えます。この場合、パラメータ\(\mu\)は定数ですから、\(\mu=172\)を満たす確率を出すことはできません。なぜなら、確率は確率変数にのみ与えられるからです。
そこで、パラメータを固定した上で、データが得られる確率を考えようとしたのが頻度論における仮説検定です。上の例で言えば、平均身長は\(\mu=172\)であるかどうかわからないけど、とりあえず\(\mu=172\)と決めつけた上でデータを得た、と考えるのです。そしてこの前提のもとで、得られたデータの平均身長が190cmだったら、「平均身長を\(\mu=172\)と決めつけたのは間違いだったのではないか」と吟味するのが頻度論における仮説検定になります。
(もっと詳しく→『仮説検定とは?初心者にもわかりやすく解説!』)
以上のことを条件付き確率で表すと、
$$P(X|H_0)$$
と書くことができます。これは帰無仮説を満たしている条件のもとで、データが得られる確率であると言えます。
ベイズ統計における仮説検定の考え方
頻度論の考え方に対し、ベイズ統計には、母集団の未知パラメータを確率変数とみなし、データを定数として扱う考え方があります。
(参考:頻度論との考え方の違い→『ベイズ統計学の考え方~ベイズ論と頻度論の違い~』)
日本人男性の平均身長について、
$$H_0:\mu\leq 172$$
という仮説検定を考えます(先ほどと違い不等式にしたのは、等式の考え方は難しいからです。等式における説明は【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜 で扱います)。この場合、パラメータ\(\mu\)は確率変数ですから、平均身長が\(\mu\leq 172\)である確率を出すことができます。
\(\mu\)は分布を持つので、\(\mu\)の密度関数を\(\pi(\mu)\)とすると、\(\mu\)が172以下である確率\(P(\mu\leq 172)\)は以下のようになることがわかります。
このように、ベイズ統計における仮説検定では、仮説を満たす確率そのものを導くことができます。さらに、これがデータが得られた上での分布(事後分布)であるならば、その確率は、条件付き確率を用いて、
$$P(H_0|X)$$
と書くことができます。これはデータが得られたもとで、帰無仮説を満たす確率になります。
まとめ〜頻度論の検定とベイズ統計の検定の違い〜
いかがでしたでしょうか。上記のことから、これら二つの違いをまとめると、
・頻度論における仮説検定
帰無仮説を満たしている条件のもとで、データが得られる確率\(P(X|H_0)\)が得られる
・ベイズ統計における仮説検定
データが得られたもとで、帰無仮説を満たす確率\(P(H_0|X)\)が得られる
ということになります。
つまり、求めている確率そのものが違います。よってベイズ統計における仮説検定は、従来の仮説検定とは全く違った考え方やアプローチで行う必要があるのです。
次の回では、例題を用いて実際に検定を行っていきます。
【第1回】ベイズ統計の仮説検定〜頻度論との違い〜 ←イマココ!
【第2回】ベイズ統計の仮説検定〜基本的な検定〜
【第3回】ベイズ統計の仮説検定〜頻度論の考え方に基づく検定〜
【第4回】ベイズ統計の仮説検定〜ベイズファクター〜
【第5回】ベイズ統計の仮説検定〜点帰無仮説の場合〜
【第6回】ベイズ統計の仮説検定〜問題点とまとめ〜
最新投稿記事
-
AIプロジェクトの企画と失敗しない進め方を解説 2021年1月19日
-
AVILEN人材育成コース受講体験談:山田裕之さん「E資格の”その先”を目指して」 2021年1月8日
-
AI導入とは?RPAとの関係、プロセス、事例、メリット、費用を詳細に解説 2020年12月7日
-
注目のAI開発企業11社!支援領域や提供方法など検証! 2020年10月28日
-
AI人材を育成できる研修プログラムを一挙紹介! 2020年10月20日
-
【2021年版】期待のAI資格11選!就職・転職にも使える! 2020年10月18日
-
JDLAとは?G検定、E資格の認定プログラム、合格者の会など紹介! 2020年10月14日
-
G検定(2020#3)受験申し込み開始、11月7日(土)実施-JDLA 2020年10月1日
-
【独占】コロナ禍で人材登録急増、アノテーション単月売上高は4倍超-パソナJOB HUB 2020年10月1日
-
E資格を転職に活用!評判とデータを徹底調査! 2020年9月29日
週間ランキング
【2021年版】コスパ重視のG検定対策!おすすめの本・講座・教材を一挙紹介! 2020年6月6日
G検定に短期間・独学で合格した勉強法を解説! 2020年8月3日
【2021年版】期待のAI資格11選!就職・転職にも使える! 2020年10月18日
G検定は難しい?難易度・合格ライン・問題を徹底解説! 2020年6月19日
注目のAI開発企業11社!支援領域や提供方法など検証! 2020年10月28日
G検定に落ちた人、合格した人。勉強法の違いはどこにある? 2020年6月25日
最弱オセロを初めて攻略した天才オセロ高校生。負け方を解説! 2020年7月31日
【2021年版】E資格とは?大注目のディープラーニングの資格を解説! 2020年9月29日
E資格の難易度を、合格率と問題から徹底分析! 2020年8月11日
MLOpsとは|定義、メリット、課題、ツール、ワークフローを分かりやすく解説 2020年9月18日

COMMENT
-
賀蕊ぜい 2017.12.11 1:49 PM
とてもいいサイトです。
賀蕊ぜい 2017.12.11 1:49 PM
とてもいいサイトです。