時系列分析

時系列分析とは

様々な分析で使用する多くのデータは、測定対象となるデータそのものとは別に、測定された時間の情報をセットで保持していることも多く、時間に関するデータがあるというだけで、これらはすべて時系列データである、と思ってしまいがちです。

しかし実際のところ、時系列データとは、ある「一定の間隔」で測定された結果の集まりを指します。

つまり、一定の間隔ではなく、発生したタイミングで測定されたデータは点過程データと呼び、時系列データとは明確に区別されます。では、両者は何が違うのかというと、時系列データは今回の測定値と、前回(次回)の測定値をつないで変化の経緯を予想するようなグラフになるのに対して、点過程データはあくまで離散事象でのその時点の測定値なので、その値分の長い線が引かれるだけで、隣の測定値との比較は行いません。

時間軸で変わるデータとしては、

  1. 傾向変動:長期的にみて上昇傾向か、下降傾向かを示す
  2. 循環変動:ある一定の期間で周期性のあるもの
  3. 季節変動:1年を通してそれぞれの季節での変化のパターンを表すもの
  4. 不規則変動:天変地異などの予想外の変異を表すもの

が上げられますが、これらは独立して現れるものではなく、4つがそれぞれ複合して起こるものです。積算したほうが良いのか、合算のほうが良いのかなどは難しい問題ですが、4つの要因で変動しているということは知っておくべき内容です。

時系列データから傾向を読み解く目的として最も多いのが、時間軸に沿って、ある数値が変化していく傾向を理解することであり、これから先に起こることを予測することです。
つまり、「この周期的な変化がこの先も繰り返されるなら、今はこうだけど、きっと近い将来にこうなる」ということを予測することで、ビジネスなどで先手を打ってアクションができるのです。

このような場合によく使われる手法として様々なものがありますが、シンプルなものとして、「移動平均法」と「指数平滑法」を紹介します。


移動平均法

例えば、月の売上高の推移が
4月:90万、5月:100万、6月:120万、7月:110万
となっていた場合、8月の予想は直近3か月の平均をとって(100+120+110)3=110万となり、

直近2か月の場合は(120+110)/2=115万となります。

移動平均法の特徴としては

  • 時系列データを予測するときには、先行する数期分の観測データが必要
  • 平均する期の数が多いほど、平滑化される

とされ、季節性の傾向のないデータの場合は、平均する期の数を短くし、データが無作為な変動を含んでいるのであれば、平均する期の数を多くすればよいことになります。

逆に、何らかのパターンの変化を伴って変動しているのであれば、その変化に対応させるべく、平均する期の数は少ない方がよく、より多くの無作為な変動除去したいのであれば、移動平均を長くする方がよいということになります。


指数平均法

移動平均法は、先行する数期分のデータが必要であり、先行する数期のデータが等しい重み付けで扱われている為、そのデータが直近のものなのか、かなり前のデータなのかがわかりません。そこで、直近のデータほど信頼できる値として、直近のデータほど高い重み付けを行って平滑化を行う方法が指数平滑法です。

指数平滑法による予測値は次の式で表すことができます。

予測値=α×前回実績値+(1-α)×前回予測値
=前回予測値+α×(前回実績値-前回予測値)

αは重みと呼ばれ、0<α<1の範囲で設定します。αが1に近いほど直前値を重視し、0に近いほど過去の経過を重視することになりますが、αの値は過去データの蓄積などによって、予測値と実績値の予測誤差が最小になるように設定します。