2019/07/01
2020/04/14
時系列解析の検証に使われる2つの仮説検定方法
この記事では、pythonで時系列解析・分析を行っていくうえでの基礎知識として、時系列解析の検証に使われる2つの仮説検定方法について説明します。平均・分散、正規分布などの統計学の初歩の知識を前提とした初心者向け入門記事です。 以降、時点\(t\)での時系列の値・確率変数を共に \(yt\) と表しています。
時系列データを仮説検定で検証する
統計的仮説検定は、母集団についての仮説を標本に基づいて検証する枠組みの一つです。 この記事では、時系列解析で頻繁に使われるような検定として、自己相関の有無を確かめるLjung-Box検定と、定常性を確かめるADF検定を紹介します。
仮説検定では帰無仮説 \(H0\) と 対立仮説 \(H1\) という二つの仮説を設定します。 このとき、主張したい仮説は対立仮説の方で、帰無仮説は否定したい仮説とするのがポイントです。 着目する統計量(検定統計量)が帰無仮説のもとで得られる確率を計算し、その確率がとても小さければ「帰無仮説は成り立っていないだろう」という判断を下す手続きを行います。 判断を下すための閾値は事前に設定する必要があり、これを有意水準とよびます(しばしば5%が用いられる)。
仮説検定については、詳しくはこちらの記事で解説しています。
Ljung-Box検定
Ljung-Box検定は、ある時系列の自己相関が存在するかどうかを次の設定で確かめる検定です。
\(H0\) : ラグ1からラグ m までの全てで自己相関が0
\(H1\) : ラグ1から m までの自己相関のうち、少なくとも一つが0でない
有意水準を5%としたとき、検定統計量の得られる確率が5%未満であれば「有意な(意味のありそうな)自己相関がある」と判断します。 逆に5%以上であれば、「有意な自己相関があるとは言えない(どちらともいえない)」と判断します。 Ljung-Box検定は、時系列モデルをあてはめた後に残差に対して行われ、残差が独立であることを確認するためにも使用されます。 これには、説明しきれなかった部分が本当にノイズであってほしい、というモチベーションがあります。 statsmodelsではacorr_ljungbox()で実装されています。
ADF検定
拡張Dickey-Fuller (ADF) 検定は、時系列が定常であるかどうかを確かめる検定です。 4章で説明するAR( \(p\) )モデルに時系列が従うと仮定し、そのARモデルが定常であるかどうかを次の設定で検定しています。
\(H0\) : 時系列が単位根AR( \(p\) )過程に従う
\(H1\) : 時系列が定常なAR( \(p\) )過程に従う
statsmodelsではadfuller()で実装されています。
まとめ
時系列データの検定に使われる2つの検定方法について紹介しました。
時系列データ分析を行う上の基礎知識として覚えておくと良いかもしれません。
Recommended