F分布の確率密度関数をカイ二乗分布を用いて導出

更新日

F分布とカイ二乗分布の関係

F分布カイ二乗分布とは以下のような関係があります。

XXYYが互いに独立である確率変数X,YX, Yについて、XXが自由度nnのカイ二乗分布、確率変数YYが自由度mmのカイ二乗分布に従うと仮定します。

このとき、

F=XnYmF = \frac{\frac{X}{n}}{\frac{Y}{m}}

と表されるFFが従う分布を、F分布という。

F分布とカイ二乗分布の確率密度関数

F分布とカイ二乗分布の確率密度関数の形を確認しておきましょう。

カイ二乗分布の確率密度関数(自由度k)

f(x)=xk21ex22k2Γ(k2)f(x)=\frac{x^{{\frac{k}{2}}-1} \mathrm{e}^{-\frac{x}{2}}}{2^{\frac{k}{2}} \Gamma(\frac{k}{2})}

F分布の確率密度関数

f(z)=(nm)n2B(n2,m2)zn21(1+nmz)n+m2f(z) = \frac{(\frac{n}{m})^{\frac{n}{2}}}{B(\frac{n}{2}, \frac{m}{2})} \frac{z^{\frac{n}{2}-1}}{(1+\frac{n}{m}z)^{-\frac{n+m}{2}}}

ガンマ関数・ベータ関数の性質

F分布の確率密度関数の導出には、ガンマ関数とベータ関数の性質も利用するので、ここで確認しておきます。

ガンマ関数

任意の正の実数kkを用いて、以下のようにに表すことができる。

Γ(k)=0tk1etdt\Gamma(k) = \int_0^\infty t^{k-1} \mathrm{e}^{-t} dt

ベータ関数

ベータ関数はガンマ関数を用いて、以下のように表すことができる。

B(x,y)=Γ(x)Γ(y)Γ(x+y)B(x, y) = \frac{\Gamma(x)\Gamma(y)}{\Gamma(x + y)}

F分布の確率密度関数の導出

それぞれ自由度n,mn, mカイ二乗分布に従う確率変数X,YX, Yが互いに独立であるとします。

ここでXXYYの同時確率密度関数f(x,y)f(x, y)を考えます。

XXYYが互いに独立であると仮定したので、f(x,y)f(x, y)は次のように表すことができます。

f(x,y)=1Γ(n2)2n2xn21ex21Γ(m2)2m2ym21ey2=f(x) f(y)\begin{equation*}\begin{split} f(x, y) &= \frac{1}{\Gamma(\frac{n}{2})2^{\frac{n}{2}}}x^{\frac{n}{2}-1}\mathrm{e}^{-\frac{x}{2}}\frac{1}{\Gamma(\frac{m}{2})2^{\frac{m}{2}}}y^{\frac{m}{2}-1}\mathrm{e}^{-\frac{y}{2}} \\ &= f(x) \cdot f(y) \end{split}\end{equation*}

XXYYの同時確率密度関数は、XXの密度関数f(x)f(x)YYの密度関数f(y)f(y)の積で表すことができます。

f(x)f(x)は自由度nnカイ二乗分布の確率密度関数であり、f(y)f(y)は自由度mmカイ二乗分布の確率密度関数です。

次に、xxyyについて、zzwwを用いて、次のような変数変換を行います。

z=xnymz = \frac{\frac{x}{n}}{\frac{y}{m}}

w=yw = y

上記の式をxxyyについて解くと、

x=nmzwx =\frac{n}{m}zw

y=wy =w

この変換のヤコビアンを考えると、以下のような値となります。

(x,y)(z,w)=xzxwyzyw=nmwnmz01 = nmw \frac{\partial (x, y)}{\partial (z, w)} = \displaystyle \left| \begin{array}{cc} \frac{\partial x}{\partial z} & \frac{\partial x}{\partial w} \\ \frac{\partial y}{\partial z} & \frac{\partial y}{\partial w} \end{array} \right| = \left| \begin{array}{cc} \frac{n}{m}w & \frac{n}{m}z \\ 0 & 1 \end{array} \right|  =  \displaystyle \frac{n}{m}w

補足:ヤコビアンとは

ヤコビアン(Jacobian)は、多変数関数の微分に関する重要な概念です。特に、多変数関数が複数の変数に依存する場合に、その変数間の関係を理解するのに役立ちます。

具体的には、多変数関数が与えられたとき、その関数が各変数にどの程度の速さで変化するかを表す行列です。これは、関数の微分をベクトルや行列の形で表現する際に使われます。

ヤコビアンの要素は、各変数の偏微分によって得られます。

したがって、z=xnymz = \frac{\frac{x}{n}}{\frac{y}{m}}の確率密度関数f(z)f(z)を考えると次のように表せます。

g(z,w)g(z, w)というのは、zzwwの同時確率密度関数を表しています。

f(z)=0g(z,w)dw =0f(x,w)(x,y)(z,w)dw= 0f(nmzw,w)nmwdzdw=02n+m2Γ(n2)Γ(m2)(nmzw)n21en2mzwwm21ew2nmwdwdz=(nm)n2zn212n+m2Γ(n2)Γ(m2)0wn+m2ew(nz+m)2mdw\begin{equation*}\begin{split} f(z) &= \displaystyle \int_0^\infty g(z, w) dw \\ &= \displaystyle \int_0^\infty f(x, w) \frac{\partial (x, y)}{\partial (z, w)} dw \\ &= \displaystyle \int_0^\infty f(\frac{n}{m}zw, w)\frac{n}{m}w dzdw \\ &= \displaystyle \int_0^\infty \frac{2^{-\frac{n+m}{2}}}{\Gamma(\frac{n}{2})\Gamma(\frac{m}{2})}(\frac{n}{m}zw)^{\frac{n}{2}-1}\mathrm{e}^{-\frac{n}{2m}zw}w^{\frac{m}{2}-1}\mathrm{e}^{-\frac{w}{2}}\frac{n}{m}w dw dz \\ &= \displaystyle \frac{(\frac{n}{m})^{\frac{n}{2}}z^{\frac{n}{2}-1}}{2^{\frac{n+m}{2}}\Gamma(\frac{n}{2})\Gamma(\frac{m}{2})} \int_0^\infty w^{\frac{n+m}{2}}\mathrm{e}^{-\frac{w(nz+m)}{2m}} dw \end{split}\end{equation*}

同時確率密度関数g(z,w)g(z, w)wwについて積分して、zzの周辺確率密度関数を求めるという計算を行っています。

ここで、t=w(nz+m)2mt = -\frac{w(nz+m)}{2m}と変数変換を行うと、wwdwdwについて、以下のように表すことができます

w=2mtnz+mw = \frac{2mt}{nz+m}

dw=2mnz+mdtdw = \frac{2m}{nz+m}dt

これを利用すると、f(z)f(z)の5行目の式におけるwwの積分式について、次のように表すことができます。

0wn+m2ew(nz+m)2mdw=0(2mtnz+m)n+m21et2mnz+mdt=(2mnz+m)n+m20tn+m2etdt=(2mnz+m)n+m2Γ(n+m2)\begin{equation*}\begin{split} \int_0^\infty w^{\frac{n+m}{2}}\mathrm{e}^{-\frac{w(nz+m)}{2m}} dw &= \displaystyle \int_0^\infty (\frac{2mt}{nz+m})^{\frac{n+m}{2}-1}\mathrm{e}^{-t} \frac{2m}{nz+m} dt \\ &= \displaystyle (\frac{2m}{nz+m})^{\frac{n+m}{2}} \int_0^\infty t^{\frac{n+m}{2}} \mathrm{e}^{-t}dt \\ &= \displaystyle (\frac{2m}{nz+m})^{\frac{n+m}{2}} \Gamma(\frac{n+m}{2}) \end{split}\end{equation*}

補足

ガンマ関数の性質を用いて、Γ(n+m2)=0tn+m2etdt\Gamma(\frac{n+m}{2})= \int_0^\infty t^{\frac{n+m}{2}} \mathrm{e}^{-t}dtとなることを利用。

上式を代入することで、f(z)f(z)は最終的に以下の形に求まります。

f(z)=nn2mm2Γ(n+m2)Γ(n2)Γ(m2)zn21(nz+m)n+m2=(nm)n2B(n2,m2)zn21(1+nmz)n+m2\begin{equation*}\begin{split} f(z) &= \displaystyle n^{\frac{n}{2}}m^{\frac{m}{2}}\frac{\Gamma(\frac{n+m}{2})}{\Gamma(\frac{n}{2})\Gamma(\frac{m}{2})}\frac{z^{\frac{n}{2}-1}}{(nz+m)^{\frac{n+m}{2}}} \\ &= \displaystyle \frac{(\frac{n}{m})^{\frac{n}{2}}}{B(\frac{n}{2}, \frac{m}{2})} \frac{z^{\frac{n}{2}-1}}{(1+\frac{n}{m}z)^{-\frac{n+m}{2}}}\end{split}\end{equation*}

補足

B(,)B(\cdot, \cdot)はベータ関数といい、上式ではガンマ関数Γ()\Gamma(\cdot)を用いて、ベータ関数の性質の1つであるB(n2,m2)=Γ(n2)Γ(m2)Γ(n2+m2)B(\frac{n}{2}, \frac{m}{2}) = \frac{\Gamma(\frac{n}{2})\Gamma(\frac{m}{2})}{\Gamma(\frac{n}{2}+\frac{m}{2})}を利用。

関連記事

カイ二乗分布のわかりやすいまとめ

F分布とは

カイ二乗分布を用いたF分布の期待値と分散の導出

確率密度関数を用いたF分布の期待値と分散の導出

カテゴリ: F分布

関連サービス

講座一覧ページ

記事一覧はこちら

無料で統計学を学ぶ