平均値とは?Meanの意味、計算方法、AI・統計での使い方をわかりやすく解説

AIの初心者
「平均」ってAIの分野でもよく出てきますよね。Meanという言葉も見かけるのですが、何が違うのでしょうか?

AI専門家
普段「平均」と言うと、多くの場合は全ての数を足して個数で割る値を指すね。英語では Mean と呼ばれることが多く、特にこれは「算術平均」と呼ばれる平均の一種なんだ。

AIの初心者
Meanには、算術平均以外の種類もあるのですか?

AI専門家
あるよ。幾何平均や調和平均のように、データの性質によって向いている平均は変わる。AIや統計では「どの平均を使っているのか」を確認することが大切なんだ。
Meanとは。
Meanは、日本語では主に「平均値」と訳されます。AIや統計の文脈で Mean と書かれている場合、多くは算術平均を指しますが、広い意味では幾何平均や調和平均なども含む「平均」の考え方として扱われることがあります。

平均値とは何か
平均値とは、複数の数値を一つの代表的な値としてまとめたものです。数値がばらばらに並んでいると全体の傾向をつかみにくいため、中心的な位置を表す値として平均値を使います。
たとえば、テストの点数が60点、70点、80点、90点だった場合、合計は300点です。人数は4人なので、300を4で割ると平均点は75点になります。この75点を見ることで、クラス全体の成績の目安を短時間で把握できます。
商品の価格でも同じです。ある商品が100円、120円、140円で売られているなら、合計360円を3で割って平均価格は120円です。平均値は、学校、家計、ビジネス、研究、AIのデータ分析など、幅広い場面で「全体をざっくり理解する」ために使われます。
平均値の計算方法

一般的な平均値、つまり算術平均は、全ての値を足し合わせ、その個数で割ることで求めます。これは、合計量を全員に均等に配り直したとき、一つあたりがどれくらいになるかを考える方法です。
\(\bar{x}=\frac{x_1+x_2+\cdots+x_n}{n}\)ここで、x_1, x_2, ..., x_n は各データ、n はデータの個数、\bar{x} は平均値を表します。たとえば10、20、30の平均値は、(10+20+30) / 3 = 20です。
| 項目 | 説明 | 例 |
|---|---|---|
| 平均値 | 複数の数値を代表する中心的な値 | テストの平均点、商品の平均価格 |
| 計算方法 | 合計をデータの個数で割る | (60 + 70 + 80 + 90) / 4 = 75 |
| 注意点 | 極端な値があると、その影響を受けやすい | 10、20、30、100の平均は40になり、100に引っ張られる |
MeanとAverageの違い
英語では「平均」を Average と言うこともあります。日常会話では Average と Mean はほぼ同じ意味で使われますが、統計や機械学習では Mean のほうが数式や指標名としてよく登場します。
特に、プログラミングやデータ分析では mean という関数名で算術平均を計算することが多くあります。たとえば、データの特徴量の平均、予測誤差の平均、画像の画素値の平均などです。
ただし、厳密には平均には複数の種類があります。そのため、資料やコードで「mean」と書かれていても、算術平均なのか、別の平均なのか、文脈を確認することが重要です。
平均値の主な種類

平均値には、目的に応じていくつかの種類があります。最もよく使われるのは算術平均ですが、比率や変化率、速度のようなデータでは、別の平均を使ったほうが実態に合うことがあります。
算術平均は、値を足して個数で割る平均です。テストの点数、売上、気温など、通常の数量をまとめるときに向いています。
幾何平均は、倍率や成長率を扱うときに使います。たとえば、ある指標が1年目に2倍、2年目に8倍になった場合、単純に足して2で割るのではなく、積の平方根を使って平均的な倍率を考えます。2と8の幾何平均は、√(2×8)=4です。
調和平均は、速度や単価のように「1あたり」の関係を持つ値に向いています。行きが時速60km、帰りが時速40kmで同じ距離を移動した場合、平均速度は算術平均の50km/hではなく、調和平均で48km/hになります。
| 種類 | 計算の考え方 | 向いている場面 | 例 |
|---|---|---|---|
| 算術平均 | 合計を個数で割る | 点数、売上、気温など | (10 + 20 + 30) / 3 = 20 |
| 幾何平均 | 値を掛け合わせ、個数乗根を取る | 成長率、倍率、投資収益率 | √(2×8) = 4 |
| 調和平均 | 逆数の平均を取り、さらに逆数に戻す | 平均速度、単価、比率 | 2 / (1/60 + 1/40) = 48km/h |
AI・統計で平均値が使われる場面

AIや統計では、平均値はデータを要約する基本的な道具です。大量の数値をそのまま眺めても傾向はつかみにくいため、まず平均値を見て、データの中心がどのあたりにあるかを確認します。
機械学習では、データの前処理で各特徴量の平均を引いて中心をそろえることがあります。これにより、モデルが学習しやすくなる場合があります。また、予測誤差を平均してモデルの性能を評価することもあります。たとえば平均二乗誤差や平均絶対誤差のような指標では、各データの誤差をまとめるために平均が使われます。
統計では、集団の傾向を比較するときに平均値がよく使われます。新しい施策の効果を確認する、顧客満足度の変化を見る、売上の月ごとの傾向を追う、といった場面では、平均値が判断材料になります。
| 分野 | 活用例 | 得られること |
|---|---|---|
| AI・機械学習 | 特徴量の平均、誤差の平均、評価指標の集計 | データの中心やモデル性能を把握できる |
| 統計 | 集団比較、仮説検証、データ要約 | データ全体の傾向を説明しやすくなる |
| ビジネス | 売上平均、顧客満足度、平均購入単価 | 経営判断や改善施策に使える |
| 日常生活 | 平均点、平均価格、平均気温 | 目安や比較基準を作れる |
平均値を見るときの注意点

平均値は便利ですが、万能ではありません。特に注意したいのは、極端に大きい値や小さい値、つまり外れ値の影響を受けやすいことです。
たとえば、10、20、30、100という4つの値があると、平均値は40です。しかし、10、20、30という3つの値だけを見ると中心は20前後に感じられます。100という大きな値が平均値を押し上げているため、平均値だけを見ると実態より高く見えるのです。
年収の分布でも同じことが起こります。多くの人が300万円から500万円の範囲にいても、一部の非常に高い年収の人がいると、平均年収は大きく上がります。このような偏った分布では、平均値より中央値のほうが実感に近いことがあります。
AIや統計で平均値を使うときは、平均値だけで判断せず、データの分布、外れ値、中央値、最頻値、分散、標準偏差も確認することが重要です。平均値と中央値が大きく違う場合は、分布が偏っている可能性があります。
平均値、中央値、最頻値の違い
平均値と並んでよく使われる代表値に、中央値と最頻値があります。これらはどれもデータの中心や特徴を表す値ですが、意味と使いどころが違います。
中央値は、データを小さい順に並べたとき、ちょうど真ん中に来る値です。データの数が偶数の場合は、中央に近い2つの値の平均を中央値にします。中央値は外れ値の影響を受けにくいため、所得や住宅価格のように偏りが大きいデータで役立ちます。
最頻値は、データの中で最も多く出現する値です。購入者の年齢層、よく選ばれるサイズ、人気のカテゴリなど、最も典型的な選択を知りたいときに使えます。数値だけでなく、色や地域のようなカテゴリデータにも使える点が特徴です。
| 代表値 | 意味 | 特徴 | 向いている場面 |
|---|---|---|---|
| 平均値 | 合計を個数で割った値 | 全データを反映するが外れ値に弱い | 全体の平均的な水準を知りたいとき |
| 中央値 | 小さい順に並べた中央の値 | 外れ値の影響を受けにくい | 所得、価格、待ち時間など偏りやすいデータ |
| 最頻値 | 最も多く出現する値 | カテゴリデータにも使える | 人気商品、最多回答、よくある年齢層 |
まとめ
平均値は、複数の数値を一つの代表値としてまとめ、データ全体の傾向をつかむための基本的な指標です。日常でよく使う平均は算術平均で、全ての値を足して個数で割ることで求めます。
一方で、平均には算術平均だけでなく、幾何平均や調和平均もあります。成長率や倍率には幾何平均、速度や単価のような値には調和平均が向いているため、データの性質に合わせて選ぶ必要があります。
AIや統計では、平均値はデータの要約、前処理、評価指標、集団比較などで頻繁に使われます。ただし、外れ値や偏った分布があると平均値だけでは誤解を招くことがあります。中央値や最頻値、分散、標準偏差もあわせて確認することで、データをより正しく理解できます。
更新履歴
| 日付 | 内容 |
|---|---|
| 2025年2月1日 | 初回公開 |
| 2026年5月1日 | 平均値の定義、計算方法、MeanとAverageの違い、平均値の種類、AI・統計での活用例、代表値との比較を初心者向けに再構成 |
