2018/01/28
2020/04/14
ディリクレ分布の期待値・分散・共分散の導出
当ページではディリクレ分布の確率密度関数から、その期待値、分散と共分散の導出を行なっております。式だけではなく、丁寧に解説を加えることで、導出の過程を出来るだけ分かりやすくまとめました。ディレクリブンプとは簡単にいうと、ベータ分布を多変量に拡張した分布です。
ディリクレ分布とはどのような分布か?
はじめに、ディリクレ分布がどういった分布であるかを説明いたします。
確率変数X1,X2,…,Xn−1が以下のような確率密度関数f(x1,x2,…,xn−1)をもつ時、確率変数X1,X2,…,Xn−1はパラメータα1,α2,…,αnのディリクレ分布に従います。その確率密度関数は以下のように表されます。
f(x1,x2,…,xn−1)=Γ(∑ni=1αi)Γ(α1)…Γ(αn)xα1–11xα2–12…xαn–1n
ただし、n∑i=1xi=1とし、x1,…,xn≥0とする。
ここで、上記の確率密度関数についてn=2の場合を考えてみましょう。
n=2の時、ディリクレ分布の確率密度関数は次のように表せます。
f(x1,x2)=Γ(∑2i=1αi)Γ(α1)Γ(α2)xα1–11xα2–12=Γ(α1+α2)Γ(α1)Γ(α2)xα1–11xα2–12
現段階では2変量の確率密度関数ですが、先程の条件より2∑i=1xi=x1+x2=1を満たしています。つまり、x2=1–x1と表すことができます。この変形により、2変量である確率密度関数を1変量のモノとして書くことが可能となるのです。
つまり、以下の形に書き換えることができます。
f(x1)=Γ(α1+α2)Γ(α1)Γ(α2)xα1–11(1–x1)α2–1
この時点でお気づきの方もいらっしゃるかと思いますが、ここでさらに定数部分であるガンマ関数について、ベータ関数B(α1,α2)を用いて1B(α1,α2)=Γ(α1+α2)Γ(α1)Γ(α2)と表せることを利用すると、以下の形にまとまります。
f(x1)=1B(α1,α2)xα1–11(1–x1)α2–1
これはベータ分布の確率密度関数の形ですね。つまり、1変量の場合のディリクレ分布の確率密度関数は、ベータ分布の確率密度関数と一致します。
このことから、ディリクレ分布はベータ分布を多変量に拡張した分布と考えることが出来ます。
ベイズ統計におけるディリクレ分布
ディリクリ分布の使用例の一つとして、ベイズ統計学における多項分布の共役事前分布が挙げられます。
ベイズ統計学がどういった学問なのかは、『ベイズ統計学とは?初心者向けのやさしい解説』を御覧ください。
このベイズ統計において共役事前分布と呼ばれる考え方があるのですが、ディリクレ分布は多項分布の共役事前分布であることが知られているのです。共役事前分布については『ベイズ統計】共役事前分布とは?わかりやすく解説』を御覧ください。
導出に便利なガンマ関数の性質と積分公式
ディリクレ分布の期待値、分散と共分散を導出するにあたって、ガンマ関数の非常に便利な性質と積分公式を紹介します。
Γ(α+1)=αΓ(α)
上記の性質は本来であれば証明を必要としますが、今回は省略することと致します。
また、この性質により、Γ(α+2)=α(α+1)Γ(α)と変形することも出来ます。
∫∞0xα1–11…xαn–1ndx1…dxn−1=Γ(α1)…Γ(αn)Γ(∑ni=1αi)
ただし、xi≥0(1≤i≤n−1),∑n−1i=1xi≤1
上記の積分公式についても本来ならば証明を必要としますが、今回は省略することにします。
期待値の導出
では、ディリクレ分布に従う確率変数の期待値を導出していきましょう。
はじめに、確率変数X1の期待値E(X1)を求めることを考えます。
ディリクレ分布は連続型分布なので、期待値の定義(連続型確率変数の場合)より、以下のように求められます。
E(X1)=∫∞0x1f(x1,…,xn−1)dx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0x1xα1–11…xαn−1ndx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0xα11…xαn–1ndx1…dxn−1
さて、ここで先ほど紹介したガンマ関数の積分公式(∫∞0xα1–11…xαn–1ndx1…dxn−1=Γ(α1)…Γ(αn)Γ(∑ni=1αi))を利用します。
これにより、3行目の積分式は以下のように表すことができます。
∫∞0xα11…xαn–1ndx1…dxn−1=Γ(α1+1)…Γ(αn)Γ(α1+…+αn+1)=Γ(α1+1)…Γ(αn)Γ(∑ni=1αi+1)
ここでさらに、ガンマ関数の性質(Γ(α+1)=αΓ(α))を用いることで次のように表せます。
Γ(α1+1)…Γ(αn)Γ(∑ni=1αi+1)=α1Γ(α1)…Γ(αn)(∑ni=1αi)Γ(∑ni=1αi)
よって
E(X1)=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0xα11…xαn–1ndx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)α1Γ(α1)…Γ(αn)(∑ni=1αi)Γ(∑ni=1αi)=α1∑ni=1αi
となります。従って、ディリクレ分布に従う確率変数Xi(i=1,…,n−1)の期待値は以下のようになります。
E(Xi)=αi∑ni=1αi(i=1,…,n−1)
ここに、n=2(つまり、1変量である)時、ディリクレ分布の期待値は
E(X1)=α1α1+α2
と表せます。これは ベータ分布の期待値と一致します。
つまり、ディリクレ分布の期待値は1変量の時、ベータ分布の期待値となるのです。
ここで、当サイトではベータ分布の期待値を導出するページがございます。そちらも是非、参考としてご活用ください。⇨『ベータ分布の期待値・分散の導出』
分散の導出
次にディリクレ分布に従う確率変数の分散を導出します。
こちらも同様にX1の分散Var(X1)を求めることとしましょう。ここに、分散の性質より
Var(X1)=E(X21)–E(X1)2
となります。まだ求めていないE(X21)を先に導出します。こちらも同様に期待値の定義から
E(X21)=∫∞0x21f(x1,…,xn−1)dx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0x21xα1–11…xαn−1ndx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0xα1+11…xαn–1ndx1…dxn−1
となります。
さて、ここでもガンマ関数の積分公式を利用します。
そうすると、3行目の積分式は次のように表せます。
∫∞0xα1+11…xαn–1ndx1…dxn−1=Γ(α1+2)…Γ(αn)Γ(α1+…+αn+2)=Γ(α1+2)…Γ(αn)Γ(∑ni=1αi+2)
さらに、ガンマ関数の性質を適用させることで、次のように表せられます。
Γ(α1+2)…Γ(αn)Γ(∑ni=1αi+2)=α1(α1+1)Γ(α1)…Γ(αn)(∑ni=1αi)(∑ni=1αi+1)Γ(∑ni=1αi)
以上より、E(X21)は以下の値となります。
E(X21)=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0xα11…xαn–1ndx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)α1(α1+1)Γ(α1)…Γ(αn)(∑ni=1αi)(∑ni=1αi+1)Γ(∑ni=1αi)=α1(α1+1)(∑ni=1αi)(∑ni=1αi+1)
従って、先ほどの分散の公式に代入することで、Var(X1)は以下のように求まります。
Var(X1)=E(X21)–E(X1)2=α1(α1+1)(∑ni=1αi)(∑ni=1αi+1)–α21(∑ni=1αi)2=α1(∑ni=1αi–α1)(∑ni=1αi)2(∑ni=1αi+1)
よって、ディリクレ分布に従う確率変数Xi(i=1,…,n−1)の分散は以下のようになります。
Var(Xi)=αi(∑ni=1αi–αi)(∑ni=1αi)2(∑ni=1αi+1)(i=1,…,n−1)
ここでも同様にn=2の場合(つまり、1変量の場合)、以下のように変形できます。
Var(X1)=α1(∑2i=1αi)–α1(∑2i=1αi)2(∑2i=1αi+1)=α1α2(α1+α2)2(α1+α2+1)
期待値の時と同じように、1変量のディリクレ分布の分散も、ベータ分布の分散となります。
ここで、当サイトではベータ分布の分散を導出するページがございます。そちらも是非、参考としてご活用ください。⇨『ベータ分布の期待値・分散の導出』
共分散の導出
最後はディリクレ分布に従う確率変数の共分散を導出します。
例として確率変数X1,X2の共分散Cov(X1,X2)を求める場合を考えます。この時、共分散の公式より次のようになります。
Cov(X1,X2)=E(X1X2)–E(X1)E(X2)
ここで、まだ求めていないE(X1X2)を先に求めることにしましょう。
E(X1X2)=∫∞0x1x2f(x1,…,xn−1)dx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0x1x2xα1–11xα2–12…xαn−1ndx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0xα11xα22…xαn–1ndx1…dxn−1
ここで、ガンマ関数の積分公式を利用します。
そうすることで、3行目の積分式は次のようになります。
∫∞0xα11xα22…xαn–1ndx1…dxn−1=Γ(α1+1)Γ(α2+1)…Γ(αn)Γ(α1+α2+…+αn+2)=Γ(α1+1)Γ(α2+1)…Γ(αn)Γ(∑ni=1αi+2)
さらに、ガンマ関数の性質を用いることで、下記のように変形できます。
Γ(α1+1)Γ(α2+1)…Γ(αn)Γ(∑ni=1αi+2)=α1α2Γ(α1)Γ(α2)…Γ(αn)(∑ni=1αi)(∑ni=1αi+1)Γ(∑ni=1αi)
以上より、E(X1X2)は以下のように求まります。
E(X1X2)=Γ(∑ni=1αi)Γ(α1)…Γ(αn)∫∞0xα11xα22…xαn–1ndx1…dxn−1=Γ(∑ni=1αi)Γ(α1)…Γ(αn)α1α2Γ(α1)…Γ(αn)(∑ni=1αi)(∑ni=1αi+1)Γ(∑ni=1αi)=α1α2)(∑ni=1αi)(∑ni=1αi+1)
よって、共分散の公式に代入することで、Cov(X1,X2)は次のように求まります。
Cov(X1,X2)=E(X1X2)–E(X1)E(X2)=α1α2(∑ni=1αi)(∑ni=1αi+1)–α1α2(∑ni=1αi)2=−α1α2(∑ni=1αi)2(∑ni=1αi+1)
従って、ディリクレ分布に従う確率変数Xi,Xjの共分散は以下のようになります。
Cov(Xi,Xj)=−αiαj(∑ni=1αi)2(∑ni=1αi+1)(i≠j)
Recommended