オッカムの剃刀とは？具体例と機械学習での使い方をわかりやすく解説

学習

2026.07.19

オッカムの剃刀とは？具体例と機械学習での使い方をわかりやすく解説

オッカムの剃刀とは？具体例と機械学習での使い方をわかりやすく解説

AIの初心者

「オッカムの剃刀」は、AIの分野ではどういう意味なんですか？

AI専門家

簡単に言えば、物事を説明するときに必要以上の仮定を増やさない、という考え方だよ。AIでは、同じくらいデータを説明できるなら、より単純なモデルを優先するという指針になるんだ。

AIの初心者

なぜ単純なモデルを選ぶ方がよいのでしょうか？

AI専門家

理解や運用がしやすく、学習データに合わせすぎる過学習も抑えやすいからだよ。ただし、単純なら必ず正しいわけではない。その条件と注意点も順番に見ていこう。

オッカムの剃刀は、哲学や科学だけでなく、AI・機械学習のモデル選択でも役立つ考え方です。本記事では、意味を日常的な具体例から説明し、過学習・正則化・交差検証との関係、使うときの注意点まで整理します。

オッカムの剃刀とは

オッカムの剃刀とは、同じ程度に現象を説明できる複数の仮説があるなら、余分な仮定が少ない方を優先するという指針です。「必要なしにものを増やしてはならない」という考えに由来し、倹約の原理とも呼ばれます。

名称は14世紀の思想家オッカムのウィリアムにちなみます。「剃刀」は、本当に必要ではない仮定を削ぎ落とす比喩です。判断の目的は、ただ短い説明を選ぶことではありません。観測事実を同じくらい説明できるという条件の下で、追加の前提が少ない説明から検討することにあります。

したがって、「最も単純な説明は必ず正しい」という法則ではありません。新しい証拠が得られ、単純な仮説では説明できなくなれば、必要な要素を加えた仮説へ更新します。

オッカムの剃刀を具体例で理解する

空に光る物体が見えたとします。候補が「風で飛ばされた反射材付きの凧」と「遠い惑星から来た宇宙船」なら、最初に凧を調べる方が合理的です。宇宙船説には、地球外生命の存在、恒星間移動の技術、その場所を訪れる理由など、観測だけでは確認できない追加仮定が必要だからです。

仮説	必要な仮定	最初の調査
凧や気球	風、身近な飛行物、光の反射	形、移動方向、周辺の飛行情報を確認
宇宙船	地球外生命、高度な移動技術、来訪目的	身近な原因を除外した後に検討

ただし、近くに凧を揚げた記録がなく、通常では説明できない観測証拠が積み重なれば結論は変わります。オッカムの剃刀は、可能性を永久に否定する道具ではなく、調査の出発点と優先順位を決める道具です。

機械学習でオッカムの剃刀が重要な理由

機械学習のモデルは、学習データから規則性を見つけ、未知のデータを予測します。自由度の高い複雑なモデルは、学習データの細かな揺らぎや偶然のノイズまで再現できます。しかし、その細部が将来も現れるとは限りません。

学習データへ合わせすぎて、未知のデータに対する性能が落ちる状態を過学習と呼びます。過去問の答えを丸暗記した人が、少し表現の違う問題には答えられない状態に似ています。一方、モデルが単純すぎて重要な規則性まで捉えられない状態は過少適合です。

モデル選択で目指すのは、学習データを完璧に再現することではなく、未知データでも安定して使える汎化性能です。検証データで同程度の性能を示すなら、単純なモデルは理解、計算、保守、異常時の原因調査が容易なため、有力な選択肢になります。

モデルの「単純さ」を測る主な尺度

機械学習における単純さは、見た目だけでは決まりません。目的に応じて、次の尺度を組み合わせて比較します。

尺度	単純とみなせる例	確認する理由
特徴量・パラメータ数	必要な変数だけを使う	不要な自由度やデータ依存を減らせる
関数や境界の形	直線、滑らかな曲線	ノイズに反応する細かな曲がりを避けやすい
計算量	短時間・少ない資源で推論できる	運用費用や応答時間に影響する
説明可能性	予測理由を人が追跡できる	検証や説明責任を果たしやすい

パラメータ数が少ないモデルだけが常に単純とは限りません。前処理やルールが大量に必要なら、システム全体は複雑です。モデル本体だけでなく、データ準備、推論基盤、監視、更新まで含む総合的な扱いやすさを見る必要があります。

実務で使えるモデル選択の手順

まず、線形回帰や決定木など、理解しやすいベースラインを用意します。次に、学習に使っていない検証データで性能を測り、より複雑な候補と同じ評価指標で比較します。

予測したい対象と、重視する評価指標を決める。
単純なベースラインモデルを作る。
学習用と検証用のデータを分け、同じ条件で候補を比較する。
性能差が小さければ、説明性、計算費用、保守性も含めて単純な候補を優先する。
複雑なモデルを選ぶ場合は、得られる改善が追加コストに見合うか確認する。

例えば、複雑なモデルで精度が0.1ポイントだけ上がっても、推論費用が10倍になり、結果を説明できなくなるなら採用しない判断があります。逆に、病気の見逃しを大きく減らせるなら、複雑さを受け入れる価値があるかもしれません。判断は精度だけでなく、誤りの影響と運用条件に結び付けます。

正則化と交差検証はどう役立つか

正則化は、モデルが極端に複雑になることへペナルティーを与え、過学習を抑える方法です。例えば回帰モデルでは、係数が必要以上に大きくならないよう制約を加えます。複雑なモデルを完全に捨てるのではなく、使える自由度を調整する考え方です。

交差検証は、データを複数の組に分け、学習に使う部分と評価に使う部分を入れ替えながら性能を測る方法です。一度の分割だけに偶然左右されにくく、未知データへの性能を比較しやすくなります。

正則化はモデルの複雑さを制御し、交差検証はどの設定が妥当かを評価します。両者は競合する方法ではなく、正則化の強さやモデル候補を交差検証で選ぶように併用できます。

ハンロンの剃刀との違い

「剃刀」と呼ばれる考え方には、ハンロンの剃刀もあります。名前は似ていますが、対象が異なります。

考え方	主な対象	判断の要点
オッカムの剃刀	現象を説明する複数の仮説	説明力が同程度なら、余分な仮定が少ない方を優先
ハンロンの剃刀	人の行動や失敗の原因	不注意や知識不足で説明できることを、すぐ悪意のせいにしない

どちらも断定の法則ではありません。オッカムの剃刀は仮説の複雑さを、ハンロンの剃刀は他者の意図に関する過剰な推測を減らすための思考上の指針です。

オッカムの剃刀の限界と注意点

現実が複雑なら、それを説明するモデルにも必要な複雑さがあります。気象予測を気温と湿度だけで行えば扱いやすい一方、気圧、風向、地形などの重要な情報を落とし、精度が不足する可能性があります。病気の原因を一つだけに限定すれば、生活習慣や遺伝などの要因を見落とすかもしれません。

注意すべきなのは次の3点です。

単純さは真実の証明ではない：証拠との整合性を優先し、新しい証拠で仮説を更新する。
単純化しすぎない：検証データで過少適合が見られるなら、特徴量やモデルの複雑さを増やす。
単純さの尺度を明確にする：パラメータ数、計算量、説明性、運用費用のどれを重視するか決める。

必要以上に複雑にしないことと、必要な複雑さまで削らないことの両方が大切です。

まとめ

オッカムの剃刀は、同じ程度に説明できる仮説の中から、余分な仮定が少ないものを優先する指針です。機械学習では、過学習を避けて汎化性能の高いモデルを選ぶ考え方につながります。

実務では、単純なベースラインから始め、交差検証で未知データへの性能を確かめ、正則化で複雑さを調整します。精度差だけでなく、説明性、計算費用、保守性、誤りの影響も比べ、目的に対して必要十分な複雑さを選びましょう。

更新履歴

日付	内容
2025年2月2日	初回公開
2026年7月19日	具体例とモデル選択の手順を補い、過学習との関係を再整理