(第22回)ピアソンの相関係数 $r$:散布図をまず見ることが大切
現実を「統計的に理解する」ための初歩の初歩(麻生一枝)| 2021.08.19

(毎月中旬更新予定)
$\def\t#1{\text{#1}}\def\dfrac#1#2{\displaystyle\frac{#1}{#2}}$
相関というと、おそらく最もよく知られているのはピアソンの相関係数だろう。相関の強弱を測る指標で、通常 $r$ で表される。次のような文章で論文にも頻繁に登場するので、大学の論文講読の授業などで見たことのある人も、多いのではないだろうか。
小学 6 年生 200 人をランダムにえらび、そのひとり 1 人について知能指数と読解力テストの得点を記録した。この 2 変数の関係を調べたところ、統計的に有意な正の相関が見つかった ($r = 0.56,\,p = 0.01$)。
18 歳から 74 歳の男女計 1500 名について、HbA1c 値と空腹時血糖値との関係を調べたところ、$r = 0.73\ (p < 0.05)$ の相関が認められた。
さて、ここで質問なのだが、ピアソンの相関係数 $r$ で測られる「正の相関」とは、どのようなものかご存じだろうか。図1の A$\sim$C の中から選んでほしい。3 つのすべてで、片方の変数が増加するにつれて、もう片方の変数も増加している。しかし、ピアソンの相関係数で相関の強弱が測れるのは、1 つだけだ。
