相関係数の有意差の有無を知る–相関係数検定表

以前、エクセルで簡単な統計解析を行う方法を紹介した際に、ピアソンの相関係数を求める関数を紹介しました。

=pearson(配列1, 配列2)
引数引数に指定する値
配列11つ目のデータ配列
配列22つ目のデータ配列
2つの配列について、Pearsonの相関係数を返す


ではこの相関係数が有意なものなのかは、どう求めるのでしょうか。エクセルで計算していってもいいのですが、楽なのは「相関係数検定表」を参照することです。

*当然、普段はSPSSで一括して行っています。テーマは「SPSSのないで先の環境でふっと思いついた統計解析をエクセルで行う」です。

相関係数検定表(r表)


相関係数検定表(correlation coefficient r table: r表)とは、各サンプルサイズnに対して有意水準α(両側確率)となるピアソンの相関係数の絶対値を示した表のことです。

例えば、サンプルサイズ30までのr表を示します。

sample size
n
significance level: α (two-tailed probability)
0.050.01
30.9969170.999877
40.9500000.990000
50.8783390.958735
60.8114010.917200
70.7544920.874526
80.7067340.834342
90.6663840.797681
100.6318970.764592
110.6020690.734786
120.5759830.707888
130.5529430.683528
140.5324130.661376
150.5139770.641145
160.4973090.622591
170.4821460.605506
180.4682770.589714
190.4555310.575067
200.4437630.561435
210.4328580.548711
220.4227140.536800
230.4132470.525620
240.4043860.515101
250.3960700.505182
260.3882440.495808
270.3808630.486932
280.3738860.478511
290.3672780.470509
300.3610070.462892

(これ以上の数のr表については、http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/rtable.htmlに掲載されています。)

なので、ピアソンの相関係数を計算したら、これを参照して有意差があるか判断すればいいわけです。

ピアソンの相関係数のおさらい


以前から使っている私のiPhoneでの歩行データをまた使ってみます。次の図は1ヶ月間の私の1日あたりの歩数と歩行距離を、さらに曜日ごとに分けて列挙しました。

0014_1.jpg
ここで、

=pearson(B2:B31,J2:J31)

と入力すると、1ヶ月間の毎日の歩数と距離とのピアソンの相関係数が出てきます。ここでは、歩数と距離の相関係数が0.994948となりました。

では、これが有意な相関か見てみましょう。上のr表のn=30の欄を見てみると、α=0.01でも0462892なので、p < 0.01のレベルで有意な正の相関とわかります。

というわけで、各曜日の相関係数を見てみましょう。曜日によって、n=4, 5とサンプルサイズが変わりますので、r表の参照部位が変わります。

0014_2.jpg
いずれの曜日も相関係数が0.97以上と高いですね。
少し意外だったのが、大した差ではないのですが、一番歩数が多い火曜日が一番相関係数が低く、p > 0.01となりました。歩行速度の変化が大きいせいで、歩数と一歩あたりの移動距離に変化が大きいのでしょうか。
まあもっとも、サンプルサイズが小さすぎてなんとも言えませんが・・・。

参考url


・相関係数についての詳しい解説あり。
http://kusuri-jouhou.com/statistics/soukan.html

・相関係数検定表
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/rtable.html


スポンサーリンク



人気ブログランキングへ

この記事へのコメント

スポンサーリンク