2019/01/17
2020/04/14
時系列分析の基本的なモデルをわかりやすく解説
本記事では時系列分析とはどのようなものなのか、代表的な時系列モデルなどについてわかりやすく解説をしていきます。時系列分析は統計学において重要なテーマであり、統計検定やアクチュアリー試験などでも頻繁に登場します。
今回はそんな時系列分析についての理解を深めていきましょう。
時系列分析とは
まず、時系列分析とは一体なんなのでしょうか?
時系列分析とは、時間の経過に伴い変化するデータを分析することです。この時の経過とともに観察されたデータのことを時系列データと呼びます。
例えば、日によって上下する株価、年々増加する二酸化炭素濃度はどれも時系列データです。確かにどのデータも時間の経過とともに観察されていますね。他にも我々の身の回りには様々な時系列データがあふれています。
時系列データの例)
・あるコンビニの毎月の売り上げ
・年齢とともに変化する死亡確率
・音声データ
・映像データ
この記事では時系列分析を理解するために必要な時系列データの扱いに触れます。その後、複数の時系列モデルについて簡単な説明をします。
時系列データの扱い方
はじめに時系列データがどのように扱われているかについて考えていきましょう。
先ほど触れたように時系列分析は時間の経過とともにデータがどのように変化しているかを分析します。
時系列データは時間的に連続しているという特性を考慮するために特殊な変換がなされることがあります。以下では、そんな時系列データの処理について触れていきます。
原系列
時系列データは原系列とも呼ばれ、式では\( y_t \)という形で表されることが多いです。原系列の「原」は処理される前といった意味で用いられています。
差分系列、階差系列
例えば株価が一日でどれだけ変化しているかについて分析したいとします。今日の株価と昨日の株価の差を考えたくなりますね。そんな時は、時間差をとった株価のデータ\( y_t – y_{t – 1} = {\Delta}y_t \)を用いるとよいでしょう。このように、一時点前のデータとの差をとった時系列データのことを差分系列、階差系列と呼ばれます。
対数系列
対数変換された時系列データは対数系列と呼ばます。数式では\( log(y_t) \)と表します。
対数系列は、バラツキが大きすぎる時系列データを扱いやすくするために用います。
例えば、ビットコインの価格などの極端な動きをするデータに対数系列を用います。
対数差分系列
ビットコインの価格が時間によってどれだけ変化しているか、その変化率について分析したいとしましょう。そんなときに用いるのが対数差分系列です。\( {\Delta}log(y_t ) – {\Delta}log(y_{t-1} ) \)と表すこともできます。この対数差分系列は、変化率 \( \frac{ y_t – y_{t – 1} }{ y_{t – 1} } \)を近似したものとなっています。
季節調整系列
季節変動の影響を受けるデータは、季節の影響を解消するための調整が行われます。このような調整が行われたデータを季節調整系列と呼びます。
時系列データが季節の影響を受けるのは、例えば以下の二酸化炭素濃度に関するグラフを見ると納得できるでしょう。
季節によって二酸化炭素濃度がギザギザと変化しているのが見て取れます。
時系列モデルについて
ここでは時系列分析にはどんなモデルがあるかについて簡単な説明とともに紹介します。
ARモデル(自己回帰モデル)
ある時点のデータを過去のデータを用いて回帰するのがARモデルです。例えば、今日の株価を昨日の株価を用いて単回帰したモデルはARモデルです。今日の株価を昨日と一昨日の株価を用いて重回帰したモデルもまたARモデルです。
自身を過去の自分で回帰した、自己回帰とイメージすると理解しやすいのではないでしょうか。
MAモデル(移動平均モデル)
ある時点のデータが時間によって生成された乱数の線形和で表されるのがMAモデルです。今日のデータが過去に発生した複数のランダムな数の加重和になっているとイメージすると、MAモデルの雰囲気がつかめるのではないでしょうか。
詳細はMAモデルについて説明した記事で説明します。
ARMAモデル、ARIMAモデル、SARIMAモデル
ARモデルとMAモデルを組み合わせたのがARMAモデルです。ARIMAモデルでは、ARMAモデルに加えてデータの差分を取ります。SARIMAモデルは、そんなARIMAモデルに季節変動を考慮します。
ARMAモデル群はARモデル、MAモデルを組み合わせたものとして理解できるでしょう。
ARCHモデル、GARCHモデル
金融の世界では例えば株価がどのように変動するか、その変動の大きさを考えたいときがあります。このような時、時間によって変化するボラティリティ(標準偏差)の動きを表したい時用いられるのがARCH、GARCHモデルです。
状態空間モデル
「状態」と「観測値」の二つについて考える時系列モデルです。時間とともに変化する「状態」に対して、「観測値」が決まるそんなモデルとイメージするとよいでしょう。
まとめ
この記事では、時系列分析の説明から始まり複数の時系列モデルの簡単な紹介を行いました。
それぞれのモデルについての詳細については他の記事で触れたいと思います。
最新投稿記事
-
AIプロジェクトの企画と失敗しない進め方を解説 2021年1月19日
-
AVILEN人材育成コース受講体験談:山田裕之さん「E資格の”その先”を目指して」 2021年1月8日
-
AI導入とは?RPAとの関係、プロセス、事例、メリット、費用を詳細に解説 2020年12月7日
-
注目のAI開発企業11社!支援領域や提供方法など検証! 2020年10月28日
-
AI人材を育成できる研修プログラムを一挙紹介! 2020年10月20日
-
【2021年版】期待のAI資格11選!就職・転職にも使える! 2020年10月18日
-
JDLAとは?G検定、E資格の認定プログラム、合格者の会など紹介! 2020年10月14日
-
G検定(2020#3)受験申し込み開始、11月7日(土)実施-JDLA 2020年10月1日
-
【独占】コロナ禍で人材登録急増、アノテーション単月売上高は4倍超-パソナJOB HUB 2020年10月1日
-
E資格を転職に活用!評判とデータを徹底調査! 2020年9月29日
週間ランキング
【2021年版】コスパ重視のG検定対策!おすすめの本・講座・教材を一挙紹介! 2020年6月6日
G検定に短期間・独学で合格した勉強法を解説! 2020年8月3日
【2021年版】期待のAI資格11選!就職・転職にも使える! 2020年10月18日
G検定は難しい?難易度・合格ライン・問題を徹底解説! 2020年6月19日
注目のAI開発企業11社!支援領域や提供方法など検証! 2020年10月28日
G検定に落ちた人、合格した人。勉強法の違いはどこにある? 2020年6月25日
最弱オセロを初めて攻略した天才オセロ高校生。負け方を解説! 2020年7月31日
【2021年版】E資格とは?大注目のディープラーニングの資格を解説! 2020年9月29日
E資格の難易度を、合格率と問題から徹底分析! 2020年8月11日
MLOpsとは|定義、メリット、課題、ツール、ワークフローを分かりやすく解説 2020年9月18日
