平均絶対偏差とは?意味・計算方法・標準偏差との違いを初心者向けに解説

平均絶対偏差とは?データのばらつきを測る意味・計算方法・標準偏差との違い

AIの初心者

「平均絶対偏差」って、何を表す値なんですか?平均とは違うのでしょうか。

AI専門家

平均絶対偏差は、データが平均値から平均的にどれくらい離れているかを表す値だよ。データのばらつきを知りたいときに使うんだ。

AIの初心者

平均値からの距離を見れば、データの散らばり具合が分かるということですか?

AI専門家

その通り。例えばテストの平均点が70点でも、全員が70点前後なのか、40点台と90点台に分かれているのかで意味は変わるよね。平均絶対偏差は、その違いを数値で見やすくしてくれるんだ。

平均絶対偏差とは。

平均絶対偏差は、データの中心である平均値から、各データがどれくらい離れているかを平均した指標です。統計、AI、機械学習、品質管理、金融分析などで、データのばらつきを直感的に把握したいときに使われます。

平均絶対偏差とは

平均絶対偏差とは、各データと平均値との差を絶対値にし、その平均を取った値です。英語では Mean Absolute Deviation と呼ばれ、MAD と略されることもあります。

ここでいう「偏差」は、ある値が平均値からどれくらい離れているかを表します。ただし、平均との差をそのまま足すと、平均より大きい値のプラスと、平均より小さい値のマイナスが打ち消し合います。そこで平均絶対偏差では、差を絶対値にして、離れている大きさだけを見ます。

例えば、平均点が70点のテストで、ある生徒が80点なら平均から10点離れています。別の生徒が60点でも、平均からの離れ具合は同じく10点です。このように、上に離れているか下に離れているかではなく、平均値からどれくらい離れているかに注目するのが平均絶対偏差です。

平均絶対偏差で平均値からのばらつきを見るイメージ

平均値だけでは分からないデータのばらつき

データを見るとき、平均値はとても便利です。しかし、平均値だけではデータ全体の姿を十分に説明できないことがあります。

例えば、A組とB組のテスト平均点がどちらも70点だったとします。A組は全員が68点から72点の間に集まっている一方、B組は40点台の生徒と90点台の生徒が多いかもしれません。この場合、平均点は同じでも、学習状況や指導方針として考えるべき内容は大きく異なります。

平均絶対偏差を使うと、データが平均値の近くに集まっているのか、それとも広く散らばっているのかを数値で比較できます。値が小さいほど平均値の近くに集まり、値が大きいほど平均値から離れたデータが多いと解釈できます。

見る指標 分かること 注意点
平均値 データ全体の中心的な値 散らばり方は分からない
平均絶対偏差 平均値からの平均的な離れ具合 分布の形や原因までは分からない

平均絶対偏差の計算式

平均絶対偏差は、次の流れで計算します。まずデータ全体の平均値を求めます。次に、各データと平均値との差を計算し、その絶対値を取ります。最後に、それらの絶対値を合計してデータ数で割ります。

\(
\mathrm{MAD} = \frac{1}{n}\sum_{i=1}^{n}|x_i-\bar{x}|
\)

この式で、x_i は各データ、\bar{x} は平均値、n はデータの個数を表します。縦線のような記号は絶対値で、マイナスを外して距離として扱うための記号です。

平均絶対偏差の単位は、元のデータと同じです。売上個数なら「個」、点数なら「点」、気温なら「度」として読めます。そのため、初心者でも「平均からだいたい何個ずれている」「平均からだいたい何点離れている」と解釈しやすい指標です。

平均絶対偏差の計算手順を示すイメージ

具体例で見る計算手順

1週間の売上個数が、10個、12個、8個、11個、9個、13個、10個だったとします。このデータから平均絶対偏差を求めてみます。

まず平均値を求めます。合計は73個で、データ数は7日分なので、平均値は73 ÷ 7 = 約10.4個です。

次に、それぞれの日の売上個数と平均値10.4個との差を絶対値で求めます。10個の日は平均との差が0.4個、12個の日は1.6個、8個の日は2.4個です。同じように全日分を計算すると、0.4、1.6、2.4、0.6、1.4、2.6、0.4になります。

最後に、これらを合計して7で割ります。合計は9.4なので、9.4 ÷ 7 = 約1.3です。つまり、この1週間の売上は、平均10.4個から平均的に約1.3個ばらついていたと分かります。

売上個数 平均値との差の絶対値
1日目 10 0.4
2日目 12 1.6
3日目 8 2.4
4日目 11 0.6
5日目 9 1.4
6日目 13 2.6
7日目 10 0.4

標準偏差との違い

データのばらつきを表す代表的な指標には、平均絶対偏差のほかに標準偏差があります。どちらも平均との差をもとにしますが、計算のしかたと外れ値への反応が異なります。

標準偏差は、各データと平均値との差を二乗してから平均し、最後に平方根を取ります。差を二乗するため、平均値から大きく離れた値の影響が強くなります。外れ値や大きなズレを重く見たいときには、標準偏差が向いています。

一方、平均絶対偏差は差の絶対値を平均するため、標準偏差ほど極端な値を強く増幅しません。そのため、外れ値の影響を少し抑えながら、ばらつきを分かりやすく見たい場合に使いやすい指標です。

平均絶対偏差と標準偏差の外れ値への反応の違い

指標 計算の考え方 外れ値の影響 向いている場面
平均絶対偏差 平均との差の絶対値を平均する 比較的受けにくい ばらつきを直感的に説明したい場面
標準偏差 平均との差を二乗して平均し、平方根を取る 受けやすい 大きなズレや外れ値も強く反映したい場面

平均絶対偏差が役立つ場面

平均絶対偏差は、データのばらつきを素早く把握したい場面で役立ちます。計算の意味が分かりやすく、単位も元データと同じなので、分析結果を他の人に説明しやすいことも利点です。

金融分野では、投資商品の価格変動や収益率のばらつきを見るときに使えます。平均絶対偏差が大きいほど、平均的な値動きから離れる幅が大きく、価格変動が不安定だと考えられます。

製造業では、製品の寸法、重量、処理時間などの品質管理に使えます。平均絶対偏差が小さければ、製品や工程が平均値の近くにそろっていると判断しやすくなります。逆に値が大きければ、工程の調整や原因調査が必要かもしれません。

気象データでは、気温や降水量の変動性を見るときに使えます。AIや機械学習の学習データを確認するときにも、特徴量のばらつきや予測誤差の大きさを直感的に見る補助指標として利用できます。

金融、製造、気象で平均絶対偏差を活用するイメージ

分野 活用例 平均絶対偏差が大きい場合
金融 価格変動や収益率の確認 平均的な値動きから離れやすい
製造業 寸法や重量の品質管理 製品のばらつきが大きい可能性がある
気象 気温や降水量の変動性分析 天候の変化が大きい可能性がある
AI・機械学習 データや誤差のばらつき確認 特徴量や予測結果に揺れが大きい可能性がある

使うときの注意点

平均絶対偏差は分かりやすい指標ですが、これだけでデータのすべてが分かるわけではありません。平均絶対偏差が小さいことは、平均値の近くにデータが集まっていることを示しますが、なぜ集まっているのか、どのような分布になっているのかまでは説明しません。

また、平均絶対偏差は平均値を基準にするため、平均値自体が外れ値に引っ張られると、その影響を受けます。外れ値が多いデータでは、中央値を基準にした中央値絶対偏差など、別の指標も検討するとよいでしょう。

「平均偏差」という言葉にも注意が必要です。文脈によっては、平均との差をそのまま平均した値を指すことがありますが、その場合は正負が打ち消し合って0に近づきやすくなります。ばらつきの大きさを見たい場合は、絶対値を取る平均絶対偏差であることを確認しましょう。

複数のデータを比較するときは、単位、期間、計算方法をそろえることも大切です。1日単位の売上と1週間単位の売上をそのまま比べると、指標の意味がずれてしまいます。

まとめ

平均絶対偏差は、データが平均値から平均的にどれくらい離れているかを示す、分かりやすいばらつきの指標です。平均との差を絶対値にして平均するため、正負が打ち消し合わず、散らばりの大きさを直感的に把握できます。

標準偏差と比べると、平均絶対偏差は外れ値の影響を比較的受けにくく、元データと同じ単位で読めるため、初心者にも説明しやすいという特徴があります。一方で、外れ値の影響を強く反映したい分析では標準偏差が向く場合もあります。

データ分析では、平均値だけで判断せず、平均絶対偏差や標準偏差などのばらつきの指標を合わせて見ることが重要です。平均値とばらつきをセットで確認することで、データの全体像をより正確に理解できます。

データ分析で平均絶対偏差などのばらつき指標を選ぶイメージ

更新履歴

日付 内容
2025年2月1日 初回公開
2026年5月1日 平均絶対偏差の定義、計算式、具体例、標準偏差との違い、活用例と注意点を初心者向けに再構成