2018/02/15
2020/04/14
指数型分布族に分類される確率分布の一覧と証明
当ページでは指数型分布族に属する代表的な確率分布を一覧にしてまとめました。ただまとめるだけでなく、実際に数式を丁寧に追って指数型分布族に属することの証明も行っております。
目次
指数型分布族とは?
確率変数\(X\)が1つの未知パラメータ\( \theta \)を持つ確率分布に従うとします。また、その確率分布が確率(密度)関数\(f(x; \theta)\)を持つとしましょう。このとき、確率(密度)関数が以下の式によって表記できる場合、その分布は指数型分布族(exponential family of distribution)に属するといいます。
\(\begin{eqnarray*} f(x; \theta) &=& \displaystyle \exp[a(x)b(\theta) + c(\theta) + d(x)] \\ \end{eqnarray*}\)
ただし、\(a(.),b(.),c(.)\)や\(d(.)\)は既知である関数とします。さらに、\(a(x) = x\)を満たす場合、その分布は正準形(canoncial form)であると言います。また、\(\theta\)は分布の自然パラメータ(natural parameter)と呼ばれます。もし関数に興味のある未知パラメータ\(\theta\)以外に他のパラメータが存在した場合、関数\(a(.),b(.),s(.)\)や\(t(.)\)を構成する局外パラメータ(nuisance parameter)と見なして扱うものとします。
以上のように定義されている指数型分布族に分類される確率分布には一般化線形モデルを適用することが可能でしたり、またはベイズ統計においては共役事前分布をもつことが示されています。当サイトでは指数型分布族の定義だけでなく、上記の性質に対する細かい解説を加えたページもございます。そちらもご活用ください。
指数型分布族に分類される代表的な分布
指数型分布族に分類される代表的なものとして、以下のものがあります。
・正規分布
・二項分布
・多項分布
・負の二項分布
・幾何分布
・ポアソン分布
・ガンマ分布
・指数分布
・パレート分布
・ベータ分布
・ラプラス分布
・ワイブル分布
ここからはこれらが指数型分布族に分類されるということを実際に数式で追って証明していきます。
ただし、複数のパラメータを持つ確率分布については、どのパラメータが未知であるかによって指数型分布族とはならないケースがあります。具体的にどのパラメータが未知の場合だと指数型分布族には属さないのかという確認も当ページでは行いますため、長くなってしまいました。
正規分布
確率変数\(X\)が平均\(\mu\)、分散\(σ^2\)の正規分布に従うとき、確率密度関数\(f(x)\)は以下の式となります。
\(\begin{eqnarray*} f(x) = \frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]} \end{eqnarray*}\)
(参考:『正規分布の分かりやすいまとめ』)
このとき、確率密度関数は次のように変形することが出来ます。
\(\begin{eqnarray*} f(x) = \exp[-\frac{x^2}{2σ^2} + \frac{x\mu}{σ^2} – \frac{\mu^2}{2σ^2} – \frac{1}{2}\log(2πσ^2) ] \end{eqnarray*}\)
パラメータが複数存在するため、3つの場合に分けて確認していきましょう。
\((a) ~ \mu;\) 未知 \( σ^2; \) 既知のとき
\(\theta = \mu\)とします。このとき、
\(\begin{eqnarray*} a(x) = x, \, b(\mu) = \frac{\mu}{σ^2}, \, c(\mu) = -\frac{\mu^2}{2σ^2} – \frac{1}{2}\log 2πσ^2, \, d(x) = -\frac{x^2}{2σ^2} \end{eqnarray*} \)
と書けるため、この場合は1パラメータの指数型分布族に属することがわかります。
また、\(a(x) = x\)と表せることから正準形であることもわかりますね。
\((b) ~ \mu;\) 既知 \( σ^2; \) 未知のとき
\(\theta = σ^2\)とします。このとき、
\(\begin{eqnarray*} a(x) = (x – \mu)^2, \, b(σ^2) = – \frac{\mu}{2σ^2}, \, c(σ^2) = – \frac{1}{2} \log 2πσ^2, \, d(x) = 0 \end{eqnarray*} \)
と書けるので、この場合も1パラメータの指数型分布族に属することがいえますね。
\((c) ~ \mu, σ^2\)ともに未知のとき
\(\theta = (\mu, σ^2)\)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(x) = x \\ b_{1}(\theta) = \frac{\mu}{σ^2} \end{array} \right. \left\{ \begin{array}{1} a_{2}(x) = x^2 \\ b_{2}(\theta) = – \frac{1}{2σ^2} \end{array} \right. ~ c(\theta) = -\frac{\mu^2}{2σ^2} – \frac{1}{2}\log 2πσ^2, ~ d(x) = 0 \end{eqnarray*}\)
と書けるので、この場合は2パラメータの指数型分布族に属することがわかります。
二項分布
確率変数\(X\)がパラメータ\(n, p\)の二項分布に従うとき、確率関数\(F(x=k)\)は以下の式となります。
\(\begin{eqnarray*} F(x=k) &=& \displaystyle \begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k} ~~ (k = 0, 1, 2, …) \\ \end{eqnarray*} \)
(参考:『二項分布のわかりやすいまとめ』)
このとき、確率関数は次のように変形することが出来ます。
\(\begin{eqnarray*} F(x=k) &=& \displaystyle \exp[k \log p – k \log (1-p) + n \log (1-p) + \log \begin{pmatrix}n \\ k\end{pmatrix} ] \end{eqnarray*} \)
パラメータが複数存在するため、3つの場合に分けて検証していきましょう。
\((a) ~ n;\) 未知 \( p; \) 既知のとき
\(\theta = n\)とします。このとき、
\(\begin{eqnarray*} a(k) &=& \displaystyle {\rm なし}, \, b(n) &=& \displaystyle {\rm なし}, \, c(n) &=& \displaystyle n \log (1 – p), \, d(k) &=& \displaystyle k \log p – k \log (1 – p) \end{eqnarray*} \)
となるため、指数型分布族には属さないことがわかります。
\((b) ~ n;\) 既知 \( p; \) 未知のとき
\(\theta = p\)とします。このとき、
\(\begin{eqnarray*} a(k) = k, \, b(p) = \log \frac{p}{1 – p}, \, c(p) = n \log (1 – p), \, d(k) = \log \begin{pmatrix}n \\ k\end{pmatrix} \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
また、\(a(k) = k\)となるので、正準形であることも示されています。
\((c) ~ n, p\)ともに未知のとき
\(\theta = (n, p)\)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(k) = k \\ b_{1}(\theta) = \log \frac{p}{1 – p} \end{array} \right. \left\{ \begin{array}{1} a_{2}(k) = {\rm なし} \\ b_{2}(\theta) = {\rm なし} \end{array} \right. ~~~ c(\theta) = n \log (1 – p), \, d(k) = 0 \end{eqnarray*}\)
となるため、この場合も指数型分布族には属さないことが示されました。
多項分布
確率変数\(\begin{eqnarray*} {\bf X} = (X_{1}, X_{2}, …, X_{k}) \end{eqnarray*}\)が以下の結合関数を持つときに従う確率分布を、\({\bf X}\)はパラメータ\(\begin{eqnarray*} n, {\bf P} = (p_{1}, p_{2}, …, p_{k}) \end{eqnarray*} \)の多項分布といいます。
\(\begin{eqnarray*} f(x_{1}, x_{2}, …, x_{k}) &=& \displaystyle \frac{n!}{x_{1}! x_{2}! … x_{k}!} p_{1}^{x_{1}} p_{2}^{x_{2}} … p_{k}^{x_{k}} ~~ (x_{i} \geq 0, ~~ x_{1} + … + x_{k} = n) \end{eqnarray*}\)
ただし、\(n\)は整数であり、\(p_{i}>0 ~~ (i = 1, 2, …, k), ~~ p_{1} + p_{2} + … + p_{k} = 1\)
このとき、確率関数は次のように変形することが出来ます。
\(\begin{eqnarray*} f(x_{1}, x_{2}, …, x_{k}) &=& \displaystyle \exp[ \log n! – \sum_{i=1}^k \log x_{i}! + \sum_{i=1}^k x_{i} \log p_{i}! ] \end{eqnarray*}\)
パラメータが複数存在するため、3つの場合に分けて検証しましょう。
\((a) ~ n;\) 未知 \( {\bf P} = (p_{1}, p_{2}, …, p_{k}); \) 既知のとき
\(\theta = n\)とします。このとき、
\(\begin{eqnarray*} a(x) &=& \displaystyle なし, \, b(n) &=& \displaystyle なし, \, c(n) &=& \displaystyle \log n!, \, d(x) &=& \displaystyle -\sum_{i=1}^k \log x_{i}! + \sum_{i=1}^k x_{i} \log p_{i}! \end{eqnarray*} \)
となるため、指数型分布族には属さないことがわかります。
\((b) ~ n;\) 既知 \( {\bf P} = (p_{1}, p_{2}, …, p_{k}); \) 未知のとき
\(\theta = {\bf P} = (p_{1}, p_{2}, …, p_{k})\)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(x) &=& \displaystyle x \\ b_{1}(\theta) &=& \displaystyle \log p_{1} \end{array} \right. , …, ~ \left\{ \begin{array}{1} a_{k}(x) &=& \displaystyle x_{k} \\ b_{k}(\theta) &=& \displaystyle \log p_{k} \end{array} \right. ~~~ c(\theta) &=& \displaystyle なし, \, d(x) = \log n! – \sum_{i=1}^k \log x_{i}! \end{eqnarray*}\)
となるので、指数型分布族には属さないことがわかります。
\((c) ~ n, {\bf P} = (p_{1}, p_{2}, …, p_{k})\)ともに未知のとき
\(\theta = \begin{pmatrix}n \\ {\bf P} \end{pmatrix} \)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(x) &=& \displaystyle x \\ b_{1}(\theta) &=& \displaystyle \log p_{1} \end{array} \right. , …, ~ \left\{ \begin{array}{1} a_{k}(x) &=& \displaystyle x_{k} \\ b_{k}(\theta) &=& \displaystyle \log p_{k} \end{array} \right. ~~~ c(\theta) &=& \displaystyle \log n!, \, d(x) = – \sum_{i=1}^k \log x_{i}! \end{eqnarray*}\)
となるため、この場合は\(k\)パラメータの指数型分布族に属することが示されました。
負の二項分布
確率変数\(X\)がパラメータ\(r, p\)の負の二項分布に従うとき、確率関数\(F(x)\)は以下の式となります。
\(\begin{eqnarray*} F(x) &=& \displaystyle \begin{pmatrix} r+x-1 \\ x \end{pmatrix} p^r (1 – p)^x ~~ (x = 0, 1, 2, …)\\ \end{eqnarray*}\)
ただし、\(r>0, ~ 0<p<1\)
上記の確率関数は\(r = 1\)のとき、幾何分布の確率関数と一致します。
また、上記の確率関数は次のように変形することが出来ます。
\(\begin{eqnarray*} F(x) &=& \displaystyle \exp[\log (r + x – 1)! – \log x! – \log (r – 1)! + r\log p + x\log (1 – p)] \end{eqnarray*}\)
パラメータが複数存在するため、3つの場合に分けて検証しましょう。
\((a) ~ r;\) 未知 \( p; \) 既知のとき
\(\theta = r\)とします。このとき、
\(\begin{eqnarray*} a(x) &=& \displaystyle {\rm なし}, \, b(r) &=& \displaystyle {\rm なし}, \, c(r) &=& \displaystyle -\log (r – 1)! + r\log p, \, d(x) &=& \displaystyle x\log (1 – p) + \log x! \end{eqnarray*} \)
となるため、指数型分布族には属さないことがわかります。
\((b) ~ r;\) 既知 \( p; \) 未知のとき
\(\theta = p\)とします。このとき、
\(\begin{eqnarray*} a(x) = x, \, b(p) = \log (1 – p), \, c(p) = -\log (r – 1)! + r\log p, \, d(x) = \log (r + x – 1)! + \log x! \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
また、\(a(x) = x\)となるので、正準形であることも示されています。
\((c) ~ r, p\)ともに未知のとき
\(\theta = (r, p)\)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(x) = x \\ b_{1}(\theta) = \log (1 – p) \end{array} \right. \left\{ \begin{array}{1} a_{2}(x) = {\rm なし} \\ b_{2}(\theta) = {\rm なし} \end{array} \right. ~~~ c(\theta) = -\log (r – 1)! + r\log p, \, d(x) = -\log x! \end{eqnarray*}\)
となるため、この場合も指数型分布族には属さないことが示されました。
幾何分布
確率変数\(X\)がパラメータ\(p\)の幾何分布に従うとき、確率関数\(F(x)\)は以下の式となります。
\(\begin{eqnarray*} F(x) &=& \displaystyle p(1 – p)^x ~~ (x = 0, 1, 2, …) \end{eqnarray*}\)
このとき、確率関数は次のように変形することが出来ます。
\(\begin{eqnarray*} F(x) = \exp[x \log (1 – p) + \log p] \end{eqnarray*}\)
\(\theta = p\)とし、\(p\)は未知であるとします。このとき、
\(a(x) = x, \, b(p) = \log (1 – p), \, c(p) = \log p, \, d(x) = 0\)
となるので、幾何分布は1パラメータの指数型分布族に属することがわかります。
また、\(a(x) = x\)と表せることから、正準形であることも示されました。
ポアソン分布
確率変数\(X\)がパラメータ\(λ\)のポアソン分布に従うとき、確率関数\(F(x)\)は以下の式となります。
\(\begin{eqnarray*} F(x) &=& \displaystyle \frac{λ^x \mathrm{e}^{-λ}}{x!} ~~ (x = 0, 1, 2, …) \end{eqnarray*}\)
このとき、確率関数は次のように変形することが出来ます。
\(\begin{eqnarray*} F(x) &=& \displaystyle \exp(x \log λ – λ – \log x!) \\ \end{eqnarray*} \)
\(\theta = λ\)とし、\(λ\)は未知であるとします。このとき、
\(a(x) = x, \, b(λ) = \log λ, \, c(λ)=-λ, \, d(x) = -\log(x!)\)
と書けるため、ポアソン分布は1パラメータの指数型分布族に属することがわかります。
また、\(a(x) = x\)となることから、正準形であることも言えます。
ガンマ分布
確率変数\(X\)がパラメータ\(\alpha, \beta\)のガンマ分布に従うとき、確率密度関数\(f(x)\)は以下の式となります。
\(\begin{eqnarray*} f(x) &=& \displaystyle \frac{\beta^{\alpha}}{\Gamma(\alpha)} x^{\alpha – 1} \mathrm{e}^{-\beta x} ~~~ (x > 0) \\ \end{eqnarray*}\)
ただし、\(\alpha > 0, \beta > 0\)であり、\(\Gamma(\alpha)\)はガンマ関数
この確率密度関数は次のように変形することが出来ます。
\(\begin{eqnarray*} f(x) = \exp[\alpha \log \beta ー \log \Gamma(\alpha) + \alpha \log x – \log x – \beta x ] \end{eqnarray*} \)
パラメータが複数存在するため、3つの場合に分けて検証していきましょう。
\((a) ~ \alpha;\) 未知 \( \beta; \) 既知のとき
\(\theta = \alpha \)とします。このとき、
\(\begin{eqnarray*} a(x) = \log x, \, b(\alpha) = \alpha, \, c(\alpha) = \alpha \log \beta – \log \Gamma(\alpha), \, d(x) = \alpha \log x – \log x \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
\((b) ~ \alpha;\) 既知 \( \beta; \) 未知のとき
\(\theta = \beta\)とします。このとき、
\(\begin{eqnarray*} a(x) = x, \, b(\beta) = -\beta, \, c(\beta) = \alpha \log \beta – \log \Gamma(\alpha), \, d(x) = \alpha \log x – \log x \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
また、\(a(x) = x\)となるので、正準形であることも示されています。
\((c) ~ \alpha, \beta\)ともに未知のとき
\(\theta = (\alpha, \beta)\)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(x) = \log x \\ b_{1}(\theta) = \alpha \end{array} \right. \left\{ \begin{array}{1} a_{2}(x) = x \\ b_{2}(\theta) = -\beta \end{array} \right. ~~~ c(\theta) = n\alpha \log \beta – \log \Gamma(\alpha), \, d(x) = -\log x \end{eqnarray*}\)
となるため、2パラメータの指数型分布族には属することが示されました。
指数分布
確率変数\(X\)がパラメータ\(λ\)の指数分布に従うとき、確率密度関数\(f(x; λ)\)は以下の式となります。
\(\begin{eqnarray*} f(x; λ) &=& \displaystyle λe^{-λx} ~~ (x>0) \\ \end{eqnarray*} \)
このとき、確率密度関数は次のように変形することが出来ます。
\(\begin{eqnarray*} f(x; λ) &=& \displaystyle \exp[\log λ – λ x \log x] \\ \end{eqnarray*} \)
\(\theta = λ\)とし、\(λ\)が未知であるとします。このとき、
\(a(x) = x\log x, \, b(λ) = λ, \, c(λ)=\log λ, \, d(x) = 0\)
と書けるため、指数分布は1パラメータの指数型分布族に属することがわかります。
パレート分布
確率変数\(X\)がパラメータ\(k, \theta \)のパレート分布に従うとき、確率密度関数\(f(x)\)は以下の式となります。
\(\begin{eqnarray*} f(x) &=& \displaystyle \theta k^{\theta} x^{-\theta – 1} ~~ x \geq k \\ \end{eqnarray*}\)
ただし、\(k > 0, ~ \theta > 0\)
このとき、確率密度関数は次のように変形することができます。
\(\begin{eqnarray*} f(x) &=& \displaystyle \exp[\log \theta + \theta \log k – \theta \log x – \log x] \end{eqnarray*}\)
パラメータが複数存在するため、3つの場合に分けて検証していきましょう。
\((a) ~ k;\) 未知 \( \theta; \) 既知のとき
\(\theta = k \)とします。このとき、
\(\begin{eqnarray*} a(x) &=& \displaystyle なし, \, b(k) &=& \displaystyle なし, \, c(k) = \theta \log k + \log \theta , \, d(x) = -\log x \end{eqnarray*} \)
となるため、指数型分布族には属さないことがわかります。
\((b) ~ k;\) 既知 \( \theta; \) 未知のとき
\(\theta = \beta\)とします。このとき、
\(\begin{eqnarray*} a(x) = \log x, \, b(\theta) = -\theta , \, c(\theta) = \theta \log k + \log \theta , \, d(x) = -\log x \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
\((c) ~ k, \theta\)ともに未知のとき
\(\theta = (k, \theta)\)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(x) &=& \displaystyle なし \\ b_{1}(\theta) &=& \displaystyle なし \end{array} \right. \left\{ \begin{array}{1} a_{2}(x) = \log x \\ b_{2}(\theta) = \theta \end{array} \right. ~~~ c(\theta) = \theta \log k + \log \theta , \, d(x) = -\log x \end{eqnarray*}\)
となるため、指数型分布族には属さないことがわかります。
ベータ分布
確率変数\(X\)がパラメータ\(\alpha, \beta\)のベータ分布に従うとき、確率密度関数\(f(x)\)は以下の式となります。
\(\begin{eqnarray*} f(x) &=& \displaystyle \frac{1}{B(\alpha, \beta)} x^{\alpha – 1} (1 – x)^{\beta – 1} ~~ (0<x<1) \\ \end{eqnarray*}\)
ただし、\(\alpha > 0, \beta > 0\)であり、\(B(\alpha, \beta)\)はベータ関数
このとき、確率密度関数は次のように変形することができます。
\(\begin{eqnarray*} f(x) &=& \displaystyle \exp[-\log B(\alpha, \beta) + \alpha \log x + \beta \log (1 – x) – \log x(1 – x)] \end{eqnarray*}\)
パラメータが複数存在するため、3つの場合に分けて検証していきましょう。
\((a) ~ \alpha;\) 未知 \( \beta; \) 既知のとき
\(\theta = \alpha \)とします。このとき、
\(\begin{eqnarray*} a(x) = \log x, \, b(\alpha) = \alpha, \, c(\alpha) = -\log B(\alpha, \beta), \, d(x) = \beta \log (1 – x) – \log x(1 – x) \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
\((b) ~ \alpha;\) 既知 \( \beta; \) 未知のとき
\(\theta = \beta\)とします。このとき、
\(\begin{eqnarray*} a(x) = \log (1 – x), \, b(\beta) = -\beta, \, c(\beta) = -\log B(\alpha, \beta), \, d(x) = \alpha \log (1 – x) – \log x(1 – x) \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
\((c) ~ \alpha, \beta\)ともに未知のとき
\(\theta = (\alpha, \beta)\)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(x) = \log x \\ b_{1}(\theta) = \alpha \end{array} \right. \left\{ \begin{array}{1} a_{2}(x) = \log (1 – x) \\ b_{2}(\theta) = -\beta \end{array} \right. ~~~ c(\theta) = -\log B(\alpha, \beta), \, d(x) = -\log x(1 – x) \end{eqnarray*}\)
となるため、2パラメータの指数型分布族には属することが示されました。
ラプラス分布
確率変数\(X\)がパラメータ\(\alpha, \beta \)のラプラス分布に従うとき、確率密度関数\(f(x)\)は以下の式となります。
\(\begin{eqnarray*} f(x) &=& \displaystyle \frac{1}{2\beta} \exp \left[ -\frac{|x – \alpha|}{\beta} \right] ~~ (-\infty < x < \infty) \\ \end{eqnarray*}\)
ただし、\(-\infty < \alpha < \infty, ~~ \beta > 0\)
このとき、確率密度関数は次のように変形できます。
\(\begin{eqnarray*} f(x) &=& \displaystyle \exp \left[-\log 2\beta – \frac{|x – \alpha|}{\beta} \right] \end{eqnarray*}\)
パラメータが複数存在するため、3つの場合に分けて検証しましょう。
\((a) ~ \alpha;\) 未知 \( \beta; \) 既知のとき
\(\theta = \alpha \)とします。このとき、
\(\begin{eqnarray*} a(x) &=& \displaystyle なし, \, b(\alpha) &=& \displaystyle なし, \, c(\alpha) = -\log 2\beta, \, d(x) = 0 \end{eqnarray*} \)
となり、\(|x – \alpha|\)という上記の関数では表せない項も存在するため、指数型分布族には属さないことがわかります。
\((b) ~ \alpha;\) 既知 \( \beta; \) 未知のとき
\(\theta = \beta\)とします。このとき、
\(\begin{eqnarray*} a(x) = |x – \alpha |, \, b(\beta) = -frac{1}{\beta}, c(\beta) = -\log 2\beta, \, d(x) =0 \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
\((c) ~ \alpha, \beta\)ともに未知のとき
\(\theta = (\alpha, \beta)\)とします。このとき、
\(\begin{eqnarray*} a(x) &=& \displaystyle なし, \, b(\alpha) &=& \displaystyle なし, \, c(\alpha) = -\log 2\beta, \, d(x) = 0 \end{eqnarray*} \)
となり、\(|x – \alpha|\)という上記の関数では表せない項も存在するため、指数型分布族には属さないことがわかります。
ワイブル分布
確率変数\(X\)がパラメータ\(\alpha, \beta \)のワイブル分布に従うとき、確率密度関数\(f(x)\)は以下の式となります。
\(\begin{eqnarray*} f(x) &=& \displaystyle \alpha \beta x^{\beta – 1} \mathrm{e}^{-\alpha x^{^\beta}} (x > 0) \\ \end{eqnarray*}\)
ただし、\(\alpha > 0, ~ \beta > 0\)
特に、\(\beta = 1\)のとき、ワイブル分布の密度関数はパラメータ\(\alpha\)の指数分布の密度関数と一致します。
上記の確率密度関数は次のように変形できます。
\(\begin{eqnarray*} f(x) &=& \displaystyle \exp[\log \alpha + \log \beta + \beta \log x – \log x – \alpha x^{\beta} ] \end{eqnarray*}\)
パラメータが複数存在するため、3つの場合に分けて検証しましょう。
\((a) ~ \alpha;\) 未知 \( \beta; \) 既知のとき
\(\theta = \alpha \)とします。このとき、
\(\begin{eqnarray*} a(x) = x^{\beta}, \, b(\alpha) = -\alpha, \, c(\alpha) = \log \alpha + \log \beta , \, d(x) = \beta \log \alpha – \log x \end{eqnarray*} \)
となるので、1パラメータの指数型分布族に属することがわかります。
\((b) ~ \alpha;\) 既知 \( \beta; \) 未知のとき
\(\theta = \beta\)とします。このとき、
\(\begin{eqnarray*} a(x) = \log x, \, b(\beta) = \beta , \, c(\beta) = \log \alpha + \log \beta , \, d(x) = \log x \end{eqnarray*} \)
となります。さらに\(-\alpha x^{\beta}\)が上記の関数では定義できないことから、指数型分布族には属さないことがわかります。
\((c) ~ \alpha, \beta\)ともに未知のとき
\(\theta = (\alpha, \beta)\)とします。このとき、
\(\begin{eqnarray*} \left\{ \begin{array}{1} a_{1}(x) &=& \displaystyle なし \\ b_{1}(\theta) &=& \displaystyle なし \end{array} \right. \left\{ \begin{array}{1} a_{2}(x) = \log x \\ b_{2}(\theta) = \beta \end{array} \right. ~~~ c(\theta) = \log \alpha + \log \beta , \, d(x) = \log x \end{eqnarray*}\)
となり、\(-\alpha x^{\beta}\)という上記の関数では表せない項も存在するため、指数型分布族には属さないことがわかります。
Recommended