トリム平均とは?外れ値に強い平均値の考え方

AIの初心者
『トリム平均』って、普通の平均と何が違うんですか?

AI専門家
普通の平均は全てのデータを使うけれど、トリム平均は大きすぎる値と小さすぎる値を一定数取り除いてから平均を出すんだ。極端な値に結果を引っ張られにくいのが特徴だよ。

AIの初心者
どうして、わざわざ一部のデータを外して平均を出すんですか?

AI専門家
測定ミスや一時的な異常値が少し混ざるだけで、普通の平均は大きく動いてしまうことがあるからだよ。トリム平均を使うと、データの中心的な傾向をより安定して見やすくなるんだ。
トリム平均とは。
トリム平均とは、データを小さい順に並べたうえで、上位と下位から一定の数または割合を取り除き、残ったデータで平均値を計算する方法です。「切り捨て平均」「刈り込み平均」と呼ばれることもあり、統計、品質管理、経済分析、AI・機械学習のデータ処理などで使われます。
トリム平均が必要になる理由

平均値は、データの中心を知るためによく使われる代表的な指標です。全ての値を足し合わせてデータ数で割るだけなので分かりやすく、表計算ソフトでも簡単に求められます。しかし、平均値には極端に大きい値や小さい値、つまり外れ値に弱いという性質があります。
例えば、顧客満足度を5点満点で集めたとき、多くの人が4点か5点を付けているのに、少数の回答だけが1点だったとします。その1点が本当に重要な不満を示している場合もありますが、入力ミスや特殊な事情による回答である場合もあります。普通の平均は全ての値を同じ重みで扱うため、こうした少数の極端な値にも結果が引っ張られます。
トリム平均は、この問題に対してデータの両端をあらかじめ除外してから平均を出すことで対応します。外れ値の影響を完全になくすものではありませんが、データ全体の中心的な傾向を安定して把握しやすくなります。
トリム平均の求め方と計算式

トリム平均の求め方は、基本的には次の3段階です。まずデータを小さい順に並べ替えます。次に、下位と上位から同じ割合または同じ個数のデータを取り除きます。最後に、残ったデータだけで平均を計算します。
数式で表すと、昇順に並べたデータを x1, x2, …, xn とし、両端から k 個ずつ取り除く場合、トリム平均は次のように表せます。
\(\bar{x}_{trim} = \frac{1}{n – 2k}\sum_{i=k+1}^{n-k} x_i
\)
ここで n はデータ数、k は片側から取り除くデータ数です。例えば100個のデータから上下5個ずつ取り除くなら、k は5で、残り90個の平均を計算します。このような計算は「5%トリム平均」と表現されることがあります。
初心者が注意したいのは、何パーセント取り除くかに絶対の正解はないという点です。よく使われる例として片側5%や10%がありますが、データ数が少ないと除外後のデータが不足します。反対に、データ数が多く外れ値も多い場合は、少し大きめの割合を検討することもあります。
具体例で見るトリム平均の計算

次の10個の顧客評価を考えます。
| 並べ替え後の評価 | 1 | 4 | 4 | 4 | 5 | 5 | 5 | 5 | 5 | 10 |
|---|
普通の平均は、全ての値を足して10で割るため 4.8 になります。一方で、下位1個と上位1個を取り除くトリム平均では、1と10を除外し、残り8個の平均を出します。この場合のトリム平均は 4.625 です。
この例では差がそれほど大きく見えないかもしれません。しかし、外れ値がもっと極端だったり、少数の値が全体の判断に強く影響したりする場面では、普通の平均とトリム平均の差が分析結果の解釈を変えることがあります。大切なのは、外れ値を機械的に悪者扱いすることではなく、データの背景を確認したうえで、平均値が実態を表しているかを判断することです。
算術平均・中央値・トリム平均の違い
トリム平均を理解するには、算術平均や中央値との違いも押さえておくと便利です。算術平均は全データを使うため情報を捨てませんが、外れ値の影響を受けやすい指標です。中央値はデータを並べたときの中央の値なので、外れ値にはかなり強い一方、データ全体の大きさの情報は平均ほど反映しません。
トリム平均は、この中間に位置する考え方です。両端の極端な値だけを取り除き、中央付近の複数データを使って平均を出すため、中央値よりは多くの情報を使い、算術平均よりは外れ値に強くなります。
| 指標 | 使うデータ | 外れ値への強さ | 向いている場面 |
|---|---|---|---|
| 算術平均 | 全てのデータ | 弱い | 外れ値が少なく、全体の平均的な大きさを見たいとき |
| 中央値 | 中央の位置のデータ | 強い | 極端な値が多く、代表的な位置を知りたいとき |
| トリム平均 | 両端を除いた残りのデータ | 比較的強い | 外れ値の影響を抑えつつ、複数データの平均を使いたいとき |
トリム平均のメリット
トリム平均の大きなメリットは、外れ値の影響を抑えながら平均値として解釈できる点です。単純な平均値は、ほんの少数の異常値に引っ張られてしまうことがあります。トリム平均では両端の値を除いてから計算するため、データの中心的な傾向をより安定して捉えやすくなります。
また、計算方法が比較的分かりやすいことも利点です。高度な統計モデルを使わなくても、並べ替え、除外、平均という手順で求められます。そのため、表計算ソフト、プログラミング、統計ツールのいずれでも実装しやすく、初学者が外れ値対策を学ぶ入り口としても扱いやすい方法です。
さらに、分析結果を説明しやすい点も実務上のメリットです。「極端な上位と下位を一定割合除外した平均」と説明できるため、スポーツ採点やアンケート結果の集計など、専門家以外にも結果を共有する場面で使いやすい指標になります。
トリム平均のデメリットと注意点

トリム平均は便利ですが、万能ではありません。最も難しいのは、どの程度の割合を取り除くかを決めることです。除外割合が少なすぎると外れ値の影響が残ります。反対に、除外割合が多すぎると、本来見るべき重要なデータまで捨ててしまいます。
例えば、製品寸法の測定で明らかな入力ミスがあるなら、端の値を除く判断はしやすいかもしれません。一方、世帯収入や売上データのように、極端に大きい値そのものが重要な意味を持つ場合は、単に除外すると分析目的を損なうことがあります。外れ値が不要なノイズなのか、重要なシグナルなのかを見極めることが必要です。
また、データ数が少ない場合にも注意が必要です。10個のデータから上下2個ずつ取り除くと、残るのは6個だけです。さらに大きな割合でトリムすると、平均を出しても安定した判断材料になりにくくなります。トリム平均を使うときは、最大値、最小値、中央値、標準偏差、ヒストグラムなども併せて確認し、データ全体の形を見ながら解釈しましょう。
トリム平均の活用例

トリム平均は、極端な値の影響を抑えて中心的な傾向を見たい場面で使われます。スポーツ採点では、審判ごとのばらつきや極端な採点の影響を抑えるため、最高点と最低点を除いて集計する方式が使われることがあります。これはトリム平均に近い考え方です。
品質管理では、製品の寸法やセンサー値に一時的な測定ミスが混ざることがあります。こうした値を含めた単純平均だけを見ると、工程の状態を誤って判断する可能性があります。トリム平均を使うことで、通常時のばらつきや中心傾向を確認しやすくなります。
経済指標や市場調査でも、急激な価格変動や特殊な回答の影響を抑えて、より安定した傾向を見るためにトリム平均の考え方が利用されます。ECサイトのレビュー分析、アンケート調査、アクセス解析などでも、極端な値を含むデータを扱うときに役立ちます。
AI・機械学習での使いどころ
AIや機械学習では、学習データや評価指標に外れ値が混ざることがあります。例えば、センサーデータに一時的なノイズが入ったり、ログデータに異常なアクセス数が含まれたりするケースです。こうした外れ値をそのまま平均に含めると、モデルの学習や評価の解釈が不安定になることがあります。
トリム平均は、前処理や評価結果の集計で、極端な値に左右されにくい代表値を見たいときに役立ちます。ただし、異常検知のように外れ値そのものが分析対象になる場合は、トリム平均で取り除いてしまうと重要な情報を失います。AI分野で使う場合も、目的が「ノイズを抑えたい」のか「異常を見つけたい」のかを先に整理することが大切です。
まとめ
トリム平均とは、データを小さい順に並べ、上位と下位から一定数または一定割合を除外してから平均を出す方法です。普通の平均よりも外れ値に強く、データの中心的な傾向を安定して見たいときに役立ちます。
一方で、除外割合の決め方には注意が必要です。外れ値に見える値が測定ミスなのか、重要な変化を示す値なのかによって、扱い方は変わります。トリム平均だけで結論を出すのではなく、中央値、最大値、最小値、標準偏差、ヒストグラムなどと合わせて確認すると、より納得しやすい分析になります。
統計やAIを学び始めた段階では、まず「外れ値に引っ張られにくい平均」と理解すると分かりやすいでしょう。そのうえで、どの値を除くのか、なぜ除くのかを説明できるようにすると、実務でも学習でも使いやすい指標になります。
更新履歴
| 日付 | 内容 |
|---|---|
| 2025年2月1日 | 初回公開 |
| 2026年5月4日 | トリム平均の定義、求め方、計算式、算術平均・中央値との違い、AIや実務での活用例を初心者向けに再構成 |
