ベクトル自己回帰モデルとは?VARモデルの意味・仕組み・活用例を解説

AIの初心者
「ベクトル自己回帰モデル」って何ですか?名前だけ見るとかなり難しそうです。

AI専門家
簡単に言うと、複数の時系列データが時間の中でどう影響し合うかを調べ、将来を予測するためのモデルだよ。気温、湿度、気圧を一緒に見て天気の変化を考えるようなイメージだね。

AIの初心者
複数のデータをまとめて扱うから「ベクトル」なんですね。

AI専門家
その通り。さらに「自己回帰」は、過去の値を使って現在や未来の値を説明する考え方だ。VARモデルでは、自分自身の過去だけでなく、他の変数の過去も一緒に使って予測するんだ。
ベクトル自己回帰モデルとは。
ベクトル自己回帰モデルは、複数の時系列データをまとめて扱い、それぞれの過去の値が現在や未来の値にどう関係するかを表す統計モデルです。英語では Vector Autoregression と呼ばれ、一般に VARモデル と略されます。

ベクトル自己回帰モデルとは
ベクトル自己回帰モデル(VARモデル)は、複数の時系列データを同時に分析するための自己回帰モデルです。時系列データとは、日ごとの気温、月ごとの売上、時点ごとの株価のように、時間の順序を持って並ぶデータを指します。
通常の自己回帰モデルは、ある変数の過去の値から同じ変数の現在値や未来値を説明します。たとえば、今日の気温を昨日や一昨日の気温から予測する考え方です。一方、VARモデルでは、気温だけでなく湿度、気圧、売上、広告費、金利など、複数の変数をまとめて扱います。
重要なのは、VARモデルが「それぞれの変数が自分自身の過去だけでなく、他の変数の過去からも影響を受ける」と考える点です。気温がアイスクリームの売上に影響し、広告費が翌週の売上に影響し、金利の変化が株価や為替に遅れて反映される、といった関係を一つの枠組みで扱えます。
VARモデルが必要になる理由
現実のデータは、一つの要因だけで動くとは限りません。商品の売上は過去の売上傾向だけでなく、気温、広告費、競合商品の動き、曜日や季節にも影響されます。経済指標も同様で、GDP、物価、金利、為替、株価は互いに関連しながら変化します。
VARモデルは、複数の時系列データの相互作用をまとめて捉えたいときに有効です。たとえば、気温、アイスクリームの売上、冷たい飲み物の販売量を同時に分析すれば、気温の変化がどの程度遅れて売上に現れるのか、売上同士に連動があるのかを確認できます。
この性質は、予測だけでなく、意思決定にも役立ちます。将来の需要を見込んで仕入れを調整したり、広告費の変化が売上へ波及するタイミングを見たり、政策変更が経済指標へ与える影響を調べたりできます。
自己回帰モデルとの違い
自己回帰モデル(ARモデル)とVARモデルの違いは、扱う変数の数と影響関係の範囲にあります。ARモデルは基本的に一つの時系列を対象にし、その系列の過去値から将来を予測します。VARモデルは複数の時系列を対象にし、各変数の過去値をまとめて説明変数として使います。

| モデル | 扱うデータ | 考え方 | 向いている例 |
|---|---|---|---|
| 自己回帰モデル(ARモデル) | 主に一つの時系列 | 自分自身の過去の値から予測する | 気温、売上、株価などを単独で予測する |
| ベクトル自己回帰モデル(VARモデル) | 複数の時系列 | 複数変数の過去値を使って相互関係を表す | 気温と売上、金利と株価、広告費と需要を同時に分析する |
たとえば気温だけを予測したい場合でも、湿度や風速が強く関係しているなら、ARモデルだけでは説明が不足することがあります。VARモデルなら、気温、湿度、風速を一つのベクトルとして扱い、互いの影響を含めて予測できます。
ベクトルと行列で表す基本式
VARモデルでは、複数の変数をまとめたものをベクトルとして扱います。たとえば、ある日の気温、アイスクリーム売上、飲料売上を一つの縦の並びとしてまとめると、その時点の状態を表すベクトルになります。

1期前の値だけを使う単純なVARモデルは、次のように表せます。
\(\mathbf{y}_t = \mathbf{c} + A_1\mathbf{y}_{t-1} + \mathbf{u}_t
\)
ここで、\(\mathbf{y}_t\) は現在時点の複数変数をまとめたベクトル、\(\mathbf{y}_{t-1}\) は一つ前の時点のベクトルです。\(A_1\) は各変数がどの変数にどれだけ影響するかを表す係数行列、\(\mathbf{c}\) は定数項、\(\mathbf{u}_t\) はモデルでは説明しきれない誤差を表します。
実務では1期前だけでなく、2期前、3期前の値も使うことがあります。この「何期前まで使うか」をラグ次数と呼びます。ラグを増やすと過去の影響を細かく捉えられますが、必要なデータ量が増え、過学習もしやすくなります。
時系列データ分析での使い方
VARモデルは、複数の時系列データを並べて、過去の関係から将来を予測したり、変数同士のつながりを調べたりする場面で使われます。製品の売上予測なら、過去の売上だけでなく、広告費、価格、競合商品の売上、季節要因などを一緒に扱うことで、単独の系列だけを見るよりも現実に近い分析ができます。
また、VARモデルは変動パターンの分析にも役立ちます。ある変数に急な変化が起きたとき、他の変数にどのような影響がどれくらい遅れて現れるかを調べる分析に使われることがあります。経済学では、金利の変化が物価や生産、為替にどう波及するかを見る用途が代表的です。
ただし、VARモデルが示す関係は、何も考えずにそのまま因果関係と見なせるわけではありません。変数の選び方、データ期間、外部要因、統計的な前提を確認しながら解釈する必要があります。
モデルの推定と評価
VARモデルを使うには、まず過去データから係数を推定します。係数とは、ある変数の過去値が別の変数の現在値にどのくらい関係しているかを表す数値です。推定には、最小二乗法などの統計的な方法が使われます。

推定した後は、モデルの当てはまりや予測性能を確認します。予測誤差が大きい場合は、変数の選び方、ラグ次数、分析期間、前処理を見直します。たとえば、売上データに強い季節性があるなら季節要因を考慮する、経済データの水準が長期的に上昇しているなら差分を取る、といった対応が必要になることがあります。
VARモデルは作って終わりではなく、推定、評価、改善を繰り返して使うモデルです。予測が目的なら未使用期間のデータで検証し、関係性の理解が目的なら係数やショックへの反応を慎重に読み解きます。
応用事例
VARモデルは、経済学や金融の分野でよく使われます。GDP、物価上昇率、金利、為替、株価などの関係を分析し、政策変更や市場変動の影響を調べるためです。金融では、株価、為替レート、金利の連動やリスク管理の補助に使われます。

工学では、複数センサーの時系列データをもとに機械の状態を把握したり、制御システムの挙動を分析したりする場面で利用できます。マーケティングでは、広告費、価格、売上、キャンペーン反応の関係を見て、需要予測や施策評価に役立てることができます。
| 分野 | 活用例 |
|---|---|
| 経済 | GDP、物価、金利、為替などの相互関係の分析 |
| 金融 | 株価、為替、金利の予測やリスク管理 |
| マーケティング | 広告費、売上、価格、需要の関係分析 |
| 工学 | 複数センサーの変化や制御システムの分析 |
| 医療 | 患者の指標変化や治療後の経過の分析 |
使う前に確認したい注意点
VARモデルを使うときは、データの前提を確認することが大切です。代表的な注意点は、時系列の定常性、ラグ次数の選択、変数の数、データ期間の長さです。定常性とは、平均や分散などの性質が時間によって大きく変わりすぎない状態を指します。
変数を増やしすぎると、モデルは複雑になり、必要なデータ量も増えます。関係がありそうな変数をすべて入れればよいわけではありません。分析目的に合う変数を選び、結果が安定しているかを確認する必要があります。
また、VARモデルで見つかった関係は、必ずしも直接的な原因と結果を意味しません。外部要因や共通の背景によって、複数の変数が同時に動いているだけの場合もあります。結果を読むときは、統計的な検定やドメイン知識と合わせて判断することが重要です。
まとめ
ベクトル自己回帰モデル(VARモデル)は、複数の時系列データをまとめて扱い、それぞれの過去値から現在や未来の動きを説明するモデルです。自己回帰モデルを複数変数へ拡張したものと考えると、全体像をつかみやすくなります。
VARモデルは、予測だけでなく、変数同士の相互作用や影響の遅れを調べるためにも使われます。経済、金融、マーケティング、工学、医療など応用範囲は広く、複数のデータが絡み合う現象を理解するための有力な手法です。
一方で、ラグ次数、変数選び、定常性、因果関係の解釈には注意が必要です。分析目的を明確にし、推定と評価を丁寧に行うことで、VARモデルは時系列データを読み解く強力な道具になります。
更新履歴
| 日付 | 内容 |
|---|---|
| 2025年2月1日 | 初回公開 |
| 2026年5月17日 | 式の読み方と利用時の注意点を加え、用途別の理解を補強 |
