正規分布の事後分布の平均と分散

2024.3.07

2024.3.15

ベイズ統計

正規分布の事後分布の性質
事後分布の平均、分散の導出
正規分布の事後分布の平均、分散の性質
計算例
関連記事

正規分布の事後分布の性質

正規分布に従う母集団からデータを取ってくるとき、共役事前分布は正規分布となります。よって、事前分布を正規分布としたとき、事後分布は次のようなことが言えます。

母平均 $\mu$ 、母分散 $\sigma^2$ に従う正規母集団から大きさ $n$ の標本を抽出し、標本平均 $\overline{x}$ を得たとする。母平均 $\mu$ の事前分布として平均 $\eta$ 、分散 $\tau^2$ の正規分布をとるとき、 $\mu$ の事後分布は
平均： $\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2}=\frac{\frac{n}{\sigma^2}\overline{x}+\frac{1}{\tau^2}\eta}{\frac{n}{\sigma^2}+\frac{1}{\tau^2}}$
分散： $\frac{\tau^2\sigma^2}{n\tau^2+\sigma^2}=\frac{\frac{\sigma^2\tau^2}{n}}{\frac{\sigma^2}{n}+\tau^2}$
の正規分布に従う

事後分布の平均、分散の導出

正規分布の事後分布を証明します。

事前分布は $\mu〜N(\eta,\tau^2)$ であるから、密度関数は、

$\pi(\mu)=\frac{1}{\sqrt{2\pi}\tau}exp[-\frac{(\mu-\eta)^2}{2\tau^2}]$

となります。次に、正規母集団の密度関数は

$f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp[-\frac{(x-\mu)^2}{2\sigma^2}]$

であるので、データ $x=\{x_1,x_2,...,x_n\}$ を得たとき、データがi.i.dである下では、尤度は

$f(x|\mu)=f(x_1|\mu)f(x_2|\mu)...f(x_n|\mu)$

$=\prod_{i=1}^{n}\frac{1}{\sqrt{2\pi}\sigma}exp[-\frac{(x_i-\mu)^2}{2\sigma^2}]$

$=(\frac{1}{\sqrt{2\pi}\sigma})^nexp[-\frac{(x_1-\mu)^2}{2\sigma^2}-\frac{(x_2-\mu)^2}{2\sigma^2}...-\frac{(x_n-\mu)^2}{2\sigma^2}]$

となります。ここで、指数部分のみを取り出すと

$-\frac{(x_1-\mu)^2}{2\sigma^2}-\frac{(x_2-\mu)^2}{2\sigma^2}...-\frac{(x_n-\mu)^2}{2\sigma^2}=-\frac{1}{2\sigma^2}\{(x_1-\mu)^2+(x_2-\mu)^2+...+(x_n-\mu)^2\}$

$=-\frac{1}{2\sigma^2}\{n\mu^2-2(x_1+x_2+...+x_n)\mu+(x_1^2+x_2^2+...+x_n^2)\}$

$=-\frac{1}{2\sigma^2}[n\{\mu^2-2\frac{1}{n}(x_1+x_2+...+x_n)\mu\}+(x_1^2+x_2^2+...+x_n^2)]$

$\frac{1}{n}(x_1+x_2+...+x_n)=\overline{x}$ であることを利用する

$=-\frac{1}{2\sigma^2}[n(\mu^2-2\overline{x}\mu)+(x_1^2+x_2^2+...+x_n^2)]$

$\mu$ に関して平方完成する

$=-\frac{1}{2\sigma^2}[n(\mu-\overline{x})^2-n\overline{x}^2-(x_1^2+x_2^2+...+x_n^2)]$

標本分散 $S^2=\overline{x^2}-\overline{x}^2$ を利用する

$=-\frac{1}{2\sigma^2}[n(\mu-\overline{x})^2+nS^2]$

となります。これを先ほどの尤度に戻してあげれば、

$f(x|\mu)=(\frac{1}{\sqrt{2\pi}\sigma})^nexp[-\frac{1}{2\sigma^2}\{n(\mu-\overline{x})^2+nS^2\}]$

が得られます。

よって、事後分布は、

$\pi(\mu|x)\propto(\frac{1}{\sqrt{2\pi}\sigma})^nexp[-\frac{1}{2\sigma^2}\{n(\mu-\overline{x})^2+nS^2)\}]\frac{1}{\sqrt{2\pi}\tau}exp[-\frac{(\mu-\eta)^2}{2\tau^2}]$

と計算できます。

さらに、 $\mu$ に関して定数とみなせるものは比例式から取り除けるので、

$exp[-\frac{1}{2\sigma^2}\{n(\mu-\overline{x})^2+nS^2\}]=exp[-\frac{1}{2\sigma^2}n(\mu-\overline{x})^2]exp[-\frac{1}{2\sigma^2}nS^2]$ となり、 $exp[-\frac{1}{2\sigma^2}nS^2]$ は定数とみなせる

$\pi(\mu|x)\propto exp[-\frac{1}{2\sigma^2}\{n(\mu-\overline{x})^2\}]exp[-\frac{(\mu-\eta)^2}{2\tau^2}]$

$\propto exp[-\frac{n(\mu-\overline{x})^2}{2\sigma^2}-\frac{(\mu-\eta)^2}{2\tau^2}]$

とかけます。ここで指数部分を取り出すと、

$-\frac{n(\mu-\overline{x})^2}{2\sigma^2}-\frac{(\mu-\eta)^2}{2\tau^2}$

$=-\frac{n\tau^2(\mu-\overline{x})^2+\sigma^2(\mu-\eta)^2}{2\sigma^2\tau^2}$

$\mu$ の降べきで並べる

$=-\frac{(n\tau^2+\sigma^2)\mu^2-2(n\tau^2\overline{x}+\sigma^2\eta)\mu+(n\tau^2\overline{x^2}+\sigma^2\eta^2)}{2\sigma^2\tau^2}$

$\mu$ に関して平方完成する

$=-\frac{n\tau^2+\sigma^2}{2\sigma^2\tau^2}(\mu-\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2})^2-\frac{n(\eta-\overline{x})^2}{2(n\tau^2+\sigma^2)}$

となるため、この式の第二項は元の式に戻すと定数となります。

よって事後分布は、

$\pi(\mu|x)\propto exp[-\frac{n\tau^2+\sigma^2}{2\sigma^2\tau^2}(\mu-\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2})^2]$

となります。

これは、平均 $\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2}$ 、分散 $\frac{\tau^2\sigma^2}{n\tau^2+\sigma^2}$ の正規分布に従うことが確認できます。

正規分布の事後分布の平均、分散の性質

事後分布は

平均： $\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2}=\frac{\frac{n}{\sigma^2}\overline{x}+\frac{1}{\tau^2}\eta}{\frac{n}{\sigma^2}+\frac{1}{\tau^2}}$
分散： $\frac{\tau^2\sigma^2}{n\tau^2+\sigma^2}=\frac{\frac{\sigma^2\tau^2}{n}}{\frac{\sigma^2}{n}+\tau^2}$

と書き換えることができます。この書き換えたあとの式を見ると、重要な性質が見えてきます。

まずは平均について見てみましょう。

$\frac{n}{\sigma^2}$ を $w_1$ 、 $\frac{1}{\tau^2}$ を $w_2$ とおくと、この式は

$\frac{w_1\overline{x}+w_2\eta}{w_1+w_2}$

となります。これは標本平均と事前平均の重み付けをしています。

次に分散を見てみましょう。

$\frac{\sigma^2}{n}$ が $Var(\overline{x})$ であるから、

$\frac{Var(\overline{x})\tau^2}{Var(\overline{x})+\tau^2}$

という式が得られます。

分散という統計量は、精度を表すことができます。つまり、分散の値が大きければ大きいほど、その情報の信頼性は薄いといえます。

ここで、 $\tau^2$ を無限大に近づけてみましょう。これはつまり、事前情報の信頼性がほぼない状態を示しています。すると、事後分布の平均は標本平均に近づくことがわかります。
逆に $\tau^2$ を $0$ に近づけてみましょう。これはつまり、事前情報に絶対的な信頼があることを示しています。すると、事後分布の平均は事前平均に近づくことがわかります。

計算例

実データで事後分布の平均と分散を導出してみましょう。

男子バスケットボールの選手の平均身長 $\mu$ を調べたい。事前情報として、身長の事前分布 $\mu〜N(180,15^2)$ を持っている。
いま、バスケット選手5人を無作為に抽出したとき、平均身長195を得た。バスケット選手の身長の分布は正規分布に従っているものとするとき、 $\mu$ の事後分布の平均、分散を求めよ。
ただし、バスケット選手の身長の分布の分散は $10^2$ であるとわかっている。

事前分布が $\mu〜N(\eta,\tau^2)$ であり、取ってくるデータの母集団分布が $N(\mu,\sigma^2)$ であるとき、事後分布は $\mu〜N(\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2},\frac{\tau^2\sigma^2}{n\tau^2+\sigma^2})$ に従います。