危険関数(リスク関数)とは

更新日

この記事では、危険関数(リスク関数)の定義と例題を解説します。

危険関数(リスク関数)とは

危険関数(リスク関数)とは、ある行動δδとったときに起こる損失について評価した関数です。損失関数の期待値によって表されます。

危険関数の定義

変数を次のように定義します。

・ランダム変数:XPθX 〜P_θ
・行動(決定):dd
・決定の関数:δ(x)δ(x)
・決定ddによる損失:L(θ,d)L(θ,d)

ここで、決定δδによる損失の期待値R(θ,δ)R(θ,δ)は、

R(θ,δ)=εθL[(θ,δ(x))]R(θ,δ) = ε_θL[(θ,δ(x))]

です。このRRを危険関数といいます

ここで、損失LLの評価方法は色々あり、一種類ではりません。例えば、一変量の場合であれば、二乗誤差や差の絶対値の形で、次のように表すことがあります。

L(θ,d)=(θd)2L(θ,d)=θdL(θ,d) = (θ-d)^2 \\ L(θ,d) = |θ-d|

危険関数の例題

危険関数の使いどころを例題を通して確認しましょう。

例題

Bさんの手の中に何枚のコインが入っているかをAさんが当てるゲームをします。コインは1〜5枚で握る枚数の確率は全て15\frac{1}{5}とし、実際の枚数に近い枚数を言えば、何もなし。実際の枚数と離れた数字を言ってしまうほど、重い罰ゲームを受けるとします。ここでAさんは何枚と答えるのが一番良い選択でしょうか?

Aさんの決定をdd枚とし、損失を絶対値で評価する形式を取ります。

この場合、損失の期待値はそれぞれのddにおいて次のような計算になります。

d=5εθL[(θ,d)]=15(4+3+2+1+0)=2d=5 \longrightarrow ε_θL[(θ,d)] = \frac{1}{5}(4+3+2+1+0) = 2

d=4 εθL[(θ,d)]=15(3+2+1+0+1)=1.4d=4 \longrightarrow ε_θL[(θ,d)] = \frac{1}{5}(3+2+1+0+1) = 1.4

d=3 εθL[(θ,d)]=15(2+1+0+1+2)=1.2d=3 \longrightarrow ε_θL[(θ,d)] = \frac{1}{5}(2+1+0+1+2) = 1.2

d=2 εθL[(θ,d)]=15(1+0+1+2+3)=1.4d=2 \longrightarrow ε_θL[(θ,d)] = \frac{1}{5}(1+0+1+2+3) = 1.4

d=1 εθL[(θ,d)]=15(0+1+2+3+4)=2d=1 \longrightarrow ε_θL[(θ,d)] = \frac{1}{5}(0+1+2+3+4) = 2

以上の結果から、d=3d = 3のときに損失の期待値が最小になるので、今回のゲームでは3枚と答えるのが最も安全だと言えます。

このように、行動を決定するとき、危険関数R(θ,δ)R(θ,δ)が小さくなるような行動δδを最善とする決定理論があります。

危険関数と事前分布

危険関数に対してρ(θ)ρ(θ)という事前分布を与えると、危険関数の期待値を取ることによって、行動による平均損失r(ρ,δ)r(ρ,δ)を求めることができます。それが次の式です。

r(ρ,δ)=ερR(θ,δ)=ερεθL[(θ,δ(x))]r(ρ,δ) = ε_ρR(θ,δ) = ε_ρε_θL[(θ,δ(x))]

このように、事前分布ρ(θ)ρ(θ)を与えて、rrが最小化された行動(手順)をベイズ手順といい、その時のrrベイズリスクという言い方をします。

この事前分布を考えて行動を決定するという考え方です。

この危険関数の期待値の形は、積分記号を用いて、以下のように表記されることが多いです。

r(ρ,δ)=ΘXL[(θ,δ(x))]f(xθ)ρ(θ) dxdθr(ρ,δ) = \int_Θ\int_X L[(θ,δ(x))]f(x|θ)ρ(θ) dxdθ

上式は、xxθθの同時密度関数ggについて、g(x,y)=f(xθ)ρ(θ)g(x,y) = f(x|θ)ρ(θ)が成り立つことを利用しています。

ここで、xxの周辺密度関数f(x)f(x)と、xxを与えた時のθθの分布が

f(x)=f(xθ)ρ(θ)dθg(θx)=f(xθ)ρ(θ)f(x)f(x) = \int f(x|θ)ρ(θ) dθ \\ g(θ|x) = \frac{f(x|θ)ρ(θ)}{f(x)}

になることを使うと、

r(ρ,δ)=X[ΘL[(θ,δ(x))]g(θx)dθ]f(x)dxr(ρ,δ) = \int_X \left[ \int_Θ L[(θ,δ(x))]g(θ|x)dθ\right] f(x) dx

となります。

カテゴリ: ベイズ統計