第二種の過誤

記事数:(2)

アルゴリズム

偽陽性と偽陰性:2種類の過誤

機械学習の世界では、ものを二つに分ける二値分類という方法がよく使われます。例えば、迷惑メールかどうかを判断したり、病気かどうかを調べたりする時などがそうです。この二値分類の良し悪しを判断するには、様々な方法がありますが、特に重要なのが、真陽性、真陰性、偽陽性、偽陰性という四つの考え方です。 まず、実際に正しいものを正しく正しいと判断できた場合を真陽性と言います。例えば、本当に迷惑メールであるものを、迷惑メールだと正しく判断できた場合です。次に、実際に間違っているものを正しく間違っていると判断できた場合を真陰性と言います。迷惑メールではない普通のメールを、迷惑メールではないと正しく判断できた場合がこれに当たります。 一方で、実際には間違っているものを誤って正しいと判断した場合を偽陽性と言います。例えば、普通のメールを誤って迷惑メールだと判断してしまった場合です。最後に、実際には正しいものを誤って間違っていると判断した場合を偽陰性と言います。本当に迷惑メールであるものを、普通のメールだと誤って判断してしまった場合です。 このように、二値分類は単に正しく分類できたかどうかだけでなく、どのように間違えたのかを把握することが大切です。迷惑メールの例で言えば、偽陽性だと大事なメールを見逃してしまう可能性があり、偽陰性だと迷惑メールを受け取ってしまうことになります。それぞれの状況に応じて、どのタイプの間違いをより少なくするべきかを考え、この四つの指標を組み合わせて二値分類モデルの正確さや性能を評価します。これにより、より目的に合った適切なモデルを選ぶことができます。
アルゴリズム

偽陽性と偽陰性:判断ミスを理解する

機械学習の世界では、物事を二つに分ける問題がよく出てきます。例えば、病気かどうか、メールが迷惑メールかどうかといった判断です。このような二択問題を二値分類問題と言い、その正しさを測る物差しがいくつかあります。この物差しを評価指標と呼び、特に重要なのが真陽性、真陰性、偽陰性、偽陽性の四つです。 まず、真陽性とは、実際に陽性であるものを正しく陽性と判断できた場合です。例えば、実際に病気の人に検査で陽性という結果が出た場合がこれにあたります。次に、真陰性とは、実際に陰性であるものを正しく陰性と判断できた場合です。例えば、実際に健康な人に検査で陰性という結果が出た場合です。この二つは、判断が正しかった場合を表しています。 一方で、判断を間違えてしまう場合もあります。偽陰性とは、実際には陽性なのに、陰性と判断してしまった場合です。例えば、実際に病気の人なのに検査で陰性という結果が出てしまった場合です。これは見落としに繋がり、深刻な事態を引き起こす可能性があります。最後に、偽陽性とは、実際には陰性なのに、陽性と判断してしまった場合です。例えば、健康な人なのに検査で陽性という結果が出てしまった場合です。この場合は、必要のない追加検査など、余計な手間がかかってしまう可能性があります。 このように、それぞれの指標がどんな状況を示しているのかをきちんと理解することはとても大切です。指標の意味を把握することで、二値分類のモデルの良し悪しを正しく評価し、どこを改善すればより良い結果に繋がるのかを判断する材料になります。それぞれの状況を具体的にイメージしながら、これらの指標を学ぶことで、より深く二値分類問題を理解することができます。