グローバルアベレージプーリングとは？CNNで平均を取る仕組みとメリット

アルゴリズム

2026.06.24

グローバルアベレージプーリングとは？CNNで平均を取る仕組みとメリット

グローバルアベレージプーリングとは？CNNで平均を取る仕組みとメリット

AIの初心者

グローバルアベレージプーリングは、何を平均している処理なんですか？名前だけだと少し難しく感じます。

AI専門家

画像そのものを平均するのではなく、CNNの中で作られた特徴マップをチャンネルごとに平均します。たくさんの小さな反応を、各チャンネルの代表値にまとめる処理だと考えると分かりやすいです。

AIの初心者

つまり、特徴マップが何枚もあるときに、それぞれの平均値を1つずつ出すということですか？

AI専門家

その通りです。各チャンネルの縦横方向を平均して1つの値にするので、情報をコンパクトにできます。全結合層を大きくしすぎずに済むため、計算量やメモリを抑えたい場面でも役立ちます。

グローバルアベレージプーリングは、英語では Global Average Pooling と呼ばれ、略して GAP と書かれることもあります。畳み込みニューラルネットワーク（CNN）の終盤でよく使われ、特徴マップの各チャンネルを平均値1つにまとめる処理です。

たとえば、最後の畳み込み層から7×7×512の特徴マップが出てきたとします。この場合、7×7の領域をチャンネルごとに平均するため、最終的には512個の値にまとまります。これにより、全結合層へ大量の値をそのまま渡す場合に比べて、パラメータ数や計算量を減らしやすくなります。

グローバルアベレージプーリングとは

グローバルアベレージプーリングは、CNN内部の特徴マップに対して行うプーリング処理です。ここでいう「グローバル」は、特徴マップの一部ではなく、縦横方向の全体を対象にするという意味です。「アベレージ」は平均、「プーリング」は情報を集約する処理を指します。

初心者が混同しやすい点として、GAPは入力画像のRGB値を単純に平均する処理ではありません。畳み込み層を通った後の特徴マップ、つまり「輪郭らしさ」「模様らしさ」「特定の部品らしさ」などを表す内部表現を平均します。そのため、画像分類モデルの最後に近い場所で、検出された特徴をクラス分類へ渡しやすい形に整える役割を持ちます。

従来のCNNでは、畳み込み層の後に大きな全結合層を置く構成がよく使われていました。しかし、全結合層は入力のすべての要素と出力の要素を接続するため、重みパラメータが増えやすい構造です。GAPを使うと、特徴マップをチャンネル数と同じ個数の代表値へ圧縮できるため、モデルを軽くしやすくなります。

特徴マップを平均する計算方法

GAPの計算はとても単純です。1枚の特徴マップに含まれるすべての値を足し、その値の個数で割ります。特徴マップの高さを \(H\)、幅を \(W\)、チャンネル \(c\) の位置 \((i,j)\) にある値を \(x_{i,j,c}\) とすると、出力 \(y_c\) は次のように表せます。

\(y_c = \frac{1}{H \times W}\sum_{i=1}^{H}\sum_{j=1}^{W}x_{i,j,c}\)

7×7の特徴マップであれば、1チャンネルにつき49個の値を合計し、49で割ります。これを512チャンネル分くり返すと、7×7×512の特徴マップは512個の代表値になります。重要なのは、平均はチャンネルごとに独立して計算されるという点です。複数のチャンネルを全部混ぜて1つの値にするわけではありません。

項目	内容
入力	高さ×幅×チャンネル数の特徴マップ
処理	各チャンネルの空間方向の値を平均する
出力	チャンネル数と同じ個数の代表値
例	7×7×512を512個の値へまとめる

全結合層との違い

全結合層は、前の層のすべての要素と次の層の要素をつなぎます。たとえば7×7×512の特徴マップを4096個のユニットへ渡す場合、単純に考えると7×7×512×4096個の重みが必要になります。これは非常に大きな数で、モデルサイズや計算量を押し上げます。

一方、グローバルアベレージプーリング自体は、平均を取るだけなので学習する重みを持ちません。各チャンネルを1つの値にまとめてから分類層へ渡すため、後段の構造を小さくしやすくなります。VGG系のように大きな全結合層を持つ設計と比べると、GAPを使う構成はパラメータ数を抑えやすいのが特徴です。

ただし、GAPが全結合層をすべて置き換える万能の部品というわけではありません。画像分類では相性がよい一方、空間的な位置関係を細かく残したいタスクでは、平均化によって必要な情報が薄まる場合があります。使いどころを理解するには、「情報を圧縮できる利点」と「位置情報を落とす可能性」の両方を見る必要があります。

比較項目	全結合層	グローバルアベレージプーリング
処理の考え方	多数の要素を重み付きで接続する	各チャンネルの平均値を計算する
学習パラメータ	多くなりやすい	GAP自体は持たない
得意な点	複雑な組み合わせを学習できる	モデルを軽くし、過学習を抑えやすい
注意点	計算量とメモリが増えやすい	位置情報が弱くなることがある

過学習を抑えやすい理由

過学習とは、モデルが訓練データに合わせ込みすぎて、未知のデータに対する性能が落ちる状態です。パラメータ数が多いモデルは表現力が高い反面、訓練データに含まれる偶然のノイズまで覚えてしまうことがあります。

GAPは、全結合層のように大量の重みを増やさず、特徴マップを平均で集約します。これにより、モデルの自由度を抑えやすくなります。特に画像分類では、画像内の細かな位置の違いよりも「その特徴が全体として出ているか」が重要な場合があります。そのような場面では、平均化によって細かすぎる揺れをならし、より汎化しやすい表現にできます。

もちろん、GAPだけで過学習が必ず解決するわけではありません。データ拡張、正則化、ドロップアウト、適切なモデルサイズの選択なども重要です。それでも、全結合層の巨大化を避ける設計として、GAPは過学習対策の一部になり得ます。

計算量とメモリを減らせる理由

GAPの大きな利点は、処理が単純であることです。各チャンネルの値を足して割るだけなので、巨大な行列演算を行う全結合層に比べて計算負荷を抑えやすくなります。また、重みパラメータを大量に保存する必要がないため、メモリ使用量の削減にもつながります。

この性質は、スマートフォン、タブレット、組み込み機器など、計算資源が限られる環境で特に重要です。推論時の計算量が少なければ、応答速度や消費電力の面でも有利になります。大量の画像を処理するサービスでも、モデルを軽くできることは運用コストの低下につながります。

一方で、モデル全体の速度はGAPだけで決まりません。畳み込み層の数、入力画像サイズ、チャンネル数、実行環境のハードウェアなども影響します。GAPは「終盤の接続を軽くする代表的な手段」と理解すると、過度な期待を避けながら効果を捉えられます。

モデルの解釈に役立つポイント

グローバルアベレージプーリングは、モデルの解釈性を高める場面でも役立ちます。各チャンネルの特徴マップを1つの平均値にまとめるため、どのチャンネルの反応が分類結果に影響しているかを追いやすくなります。

たとえば、あるチャンネルが「丸い形」や「縞模様」のような特徴に強く反応しているとします。そのチャンネルの平均値が大きければ、その特徴が画像全体の分類判断に寄与した可能性があります。もちろん、実際のモデル内部は単純ではありませんが、チャンネルごとの反応を分類結果と結びつけて見やすくなる点はGAPの重要な利点です。

この考え方は、クラス活性化マップのような可視化手法とも関係します。モデルが画像のどこを手がかりにしたのかを調べるとき、GAPを使った構造は説明しやすい形になりやすいのです。

使うときの注意点

GAPは便利ですが、平均化する以上、空間的な位置情報は弱くなります。画像分類のように「画像全体として何が写っているか」を判断するタスクでは、この性質がよく働きます。しかし、物体検出やセグメンテーションのように「どこにあるか」を細かく扱うタスクでは、位置情報を保つ別の設計が必要になることがあります。

また、特徴が画像の一部にだけ強く現れる場合、全体平均によって反応が薄まることもあります。小さな対象物を分類したい場合や、局所的な異常を見つけたい場合には、GAPだけに頼る設計が適切とは限りません。必要に応じて、最大値を取るグローバルマックスプーリング、注意機構、空間情報を残すヘッド構造などと比較して考えるとよいでしょう。

初心者向けにまとめると、GAPは「特徴マップ全体の代表値を作る」処理です。全体傾向を捉えるのは得意ですが、細かな位置や局所的な強い反応をそのまま残す処理ではありません。この性質を理解しておくと、モデル構造を読むときに役割を判断しやすくなります。

まとめ

グローバルアベレージプーリングは、CNNの特徴マップをチャンネルごとに平均し、各チャンネルを1つの代表値にまとめる処理です。7×7×512のような特徴マップであれば、512個の値へ圧縮できます。

主なメリットは、全結合層に比べてパラメータ数を抑えやすいこと、計算量やメモリ使用量を減らしやすいこと、過学習の抑制に役立つこと、そしてチャンネルごとの寄与を解釈しやすくなることです。一方で、位置情報が弱くなるため、画像分類以外のタスクでは使い方に注意が必要です。

GAPを理解すると、現代的なCNNの終盤がなぜシンプルな構造になっているのかが見えやすくなります。単なる平均処理に見えても、モデルを軽くし、汎化しやすくし、判断の手がかりを追いやすくする重要な部品です。

更新履歴

日付	内容
2025年1月31日	初回公開
2026年6月24日	GAPの式、全結合層との差、位置情報の注意点を追記