学習 データの関係性:相関とは
ものごとの関係の深さを知るための方法として、相関というものがあります。これは、複数のものがどれくらい似ているか、あるいは関係しているかを表す尺度です。
例えば、夏の暑い日差しの中で、冷たいアイスクリームを食べたくなる場面を想像してみてください。気温が上がると、アイスクリームの売り上げも増える傾向があります。これは、気温とアイスクリームの売り上げに正の相関があることを示しています。正の相関とは、一方が増えるともう一方も増える関係のことです。まるで、気温の上昇とともにアイスクリームの人気も上昇するシーソーのように、同じ方向に動く様子を思い浮かべてみてください。
反対に、雨の日に傘が活躍する様子を考えてみましょう。晴れの日は傘の売り上げが減り、雨の日は傘の売り上げが増えます。これは、傘の売り上げと晴れの日に負の相関があることを意味します。負の相関とは、一方が増えるともう一方が減る関係のことです。晴れの日が多くなるほど傘は売れなくなり、雨の日が多くなるほど傘は売れるという、反対方向に動く様子を想像してみてください。
相関の強さは、-1から1までの数値で表されます。1に近いほど正の相関が強く、例えば気温とアイスクリームの売り上げのように、片方が増えればもう片方も確実に増える関係を示します。逆に、-1に近いほど負の相関が強く、傘の売り上げと晴れの日のように、片方が増えればもう片方は確実に減る関係を示します。そして、0に近い場合は相関が弱い、または相関がないことを意味します。例えば、アイスクリームの売り上げと靴のサイズには、おそらく関係がないでしょう。いくらアイスクリームが売れても、人々の靴のサイズが変わることは考えにくいです。このように、相関を見ることで、ものごとの関係性を理解することができます。まるで、ものごとの間に見えない糸があるように、その関係の強さを数値で捉えることができるのです。
