SpikeM: ソーシャルメディアにおける情報拡散過程の解析

概要

ブログや Twitter をはじめとするソーシャルメディアの発展により、情報交換が活発化し、オンライン上でのニュースや噂の伝播速度が増しています。本研究では、ニュースを始めとする情報がオンラインメディア上でどのように伝わり減衰していくかに着目し、情報拡散と減衰を表現する時系列モデルの提案を行います。

spikeM_overview
提案手法とその特徴

提案モデルは、上図に挙げられるような実際の情報拡散過程における 特徴を表現する必要があります。その特徴とは、まず (a) 無限大に発散することなく必ず収束することを保証し、(b) 情報拡散はパワー則に基づき減衰していくこと、そして、(c) 周期性を持つことです。(a) については、ネットワーク上のユーザの数を有限とすることで解決し、(b) については、ネットワークの各ノード(ユーザ)の感染力をべき指数 (例えば-1.5)によって減衰させることで表現することができます。(c) については、ユーザの時間帯毎の活動の変化を考慮することでモデルをより現実的なものにします。

提案モデルは次に挙げられる2つの状態のノード(ブログユーザ)から構成されます。

U (Un-informed): ニュースの内容をまだ通知されていないブログユーザ
B (Blogged): ニュースを通知され、その後ブログに ニュースの内容をポストしたユーザ
spikeM_idea

グラフ構造:提案モデルであるSpikeMは、始めにN 人のブログユーザを想定します。この時点では、どのユーザもイベント(ニュース)について知らされておらず、ブログサイトにも記事をポストしていないものとします。

外部からのショック:続いて、時刻 nb に特定のイベントの発生を想定します。ここで言うイベントとは、例えば、津波のニュース速報や、選挙活動のスピーチに関する話題を指します。すると時刻 nb においてまず、即座に Sb 人のユーザが自身のブログにポストします。nbはイベントの誕生時刻、Sb はイ ベントの外部からのショックの強さを示します。

イベントの影響力と伝播:さらに、ニュース(イベント)の質、注目度に関するパ ラメータとして β を用います。もし β = 0 だった場合、その ニュースは誰からも注目されていないため、すぐに消えてしまいます。β が高い値の場合は、より多くのユーザが興味を持ち、ブログポストを行います。SpikeMの中で最も重要な要素は減衰関数 f(n) です。これは、時間 nが経過するにつれて、そのブログポストがどの程度の影響力を与えるかを示します。先行研究により、情報拡散における影響力はパワー則に基づき時間とともに減衰していく例が数多く見られています。本研究では、-1.5 のベキ指数を用いています。

実験結果

以下の図は、実際のデータ対してSpikeMを用いてモデル学習を行なった結果を示しています。図の通りSpikeMは、ブログメディアやTwitter等における代表的な拡散パターンを高い精度で表現することができます。

spikeM_result
関連文献
  • Yasuko Matsubara, Yasushi Sakurai, B. Aditya Prakash, Lei Li, Christos Faloutsos, “Rise and Fall Patterns of Information Diffusion: Model and Implications”, ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD), pp. 6-14, Beijing, China, August 2012. [pdf] [ppt] [code]