概要
RegimeCast は大規模時系列データストリームのための将来予測アルゴリズムです.RegimeCast は,センサデータや Web のアクセス履歴等,様々な時系列パターンから構成される大規模データストリームが与えられたとき,それらの中から重要な特徴や潜在的なトレンドを発見し, 長期的かつ継続的に将来のイベント予測を行うことができます.
提案手法とその特徴
図 1 は,MoCap データにおける時系列イベントストリームにおけるRegimeCastの出力の様子を示しています.上段はオリジナルのイベントストリームを示しており,4つのモーションキャプチャセンサ (左右の腕および足)から生成された身体の運動に関する複数のモーション(歩く,腕を動かす等)から構成されます.中段はRegimeCast を用いた際の,各時刻における 100~120ステップ先の予測結果を示しており,下段は時刻t=900におけるRegimeCastのスナップショットを示します. RegimeCastは,出力単位時刻ごとに100~120ステップ先の将来イベントを予測し続けることができます.
RegimeCastは,複数 (d個) のセンサから生成され続ける d 次元のイベントストリームに対し,効果的かつ効率的に将来イベントを予測し続けるための技術です.例えば, 自動車の走行センサや工場の各種センサ等に対し,リアルタイムにパターンを予測することにより,事故防止等の高度なサービスを提供することができます. RegimeCastは,以下の重要なコンセプトに基づきアルゴリズムのデザインをしています(図2).
- ls ステップ先の予測
- 長期的な予測能力:リアルタイム予測問題において,短期的なイベント予測は意味をなしません.本研究では,長期的な時系列パターンの動向をモデル化しls ステップ先の予測を行います.
- 連続性: データストリームの最新時刻の潜在的トレンドや時系列パターンを動的に把握・推定し,将来のイベントを継続的に予測し続けます.
- 適応型非線形動的システム
- 非線形性:既存の線形モデルでは表現できない様々なダイナミクスを非線形動的システムを用いて表現します.
- 適応力:実世界における時系列イベントストリームは,種類の異なる様々な時系列パターンから構成され,外的要因等によって突発的に変化していきます.本技術は,時系列トレンドの急激な変化(レジームシフト)をモデル化することにより,変化点を検出し,柔軟に予測を行います.
アルゴリズム
図3はRegimeCastのアルゴリズムの概要を示しています.アルゴリズムは次に挙げる 3 つの部分問題に分割されます.
- RegimeCast: イベントストリームXに対し,現時刻tcにおけるls ステップ先のイベントを予測する.
- RegimeReader: 現時刻の時系列パターン Xc が与えられたとき,モデルDBの中から適切なモデルを発見する.
- RegimeEstimator: Xcの中に新たな時系列パターンが出現した場合,新たなモデルを推定しモデルDBに格納する.
実験結果
図4は実際のデータに対してRegimeCastを用いてパターン発見を行なった結果を示しています.(a) 上段はオリジナルストリーム,下段は100~120ステップ先の予測結果,(b) は各時刻におけるスナップショットを示しています.図のように,RegimeCastは,データストリームのトレンドや変化点(レジームシフト)を柔軟に表現し,長期的な予測をすることができます.
参考文献
- Yasuko Matsubara, Yasushi Sakurai, “Regime Shifts in Streams: Real-time Forecasting of Co-evolving Time Sequences”, ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD), San Francisco, California, August 13-17, 2016. [pdf] [ppt] [code]
国内論文誌
- 松原靖子, 櫻井保志: “大規模データストリームのリアルタイム予測”, 情報処理学会論文誌:データベース, Vol.9 No.4, pp. 32-45, 2016, 12月.