=pearson(配列1, 配列2) | |
引数 | 引数に指定する値 |
---|---|
配列1 | 1つ目のデータ配列 |
配列2 | 2つ目のデータ配列 |
2つの配列について、Pearsonの相関係数を返す |
ではこの相関係数が有意なものなのかは、どう求めるのでしょうか。エクセルで計算していってもいいのですが、楽なのは「相関係数検定表」を参照することです。
*当然、普段はSPSSで一括して行っています。テーマは「SPSSのないで先の環境でふっと思いついた統計解析をエクセルで行う」です。
相関係数検定表(r表)
相関係数検定表(correlation coefficient r table: r表)とは、各サンプルサイズnに対して有意水準α(両側確率)となるピアソンの相関係数の絶対値を示した表のことです。
例えば、サンプルサイズ30までのr表を示します。
sample size n | significance level: α (two-tailed probability) | |
---|---|---|
0.05 | 0.01 | |
3 | 0.996917 | 0.999877 |
4 | 0.950000 | 0.990000 |
5 | 0.878339 | 0.958735 |
6 | 0.811401 | 0.917200 |
7 | 0.754492 | 0.874526 |
8 | 0.706734 | 0.834342 |
9 | 0.666384 | 0.797681 |
10 | 0.631897 | 0.764592 |
11 | 0.602069 | 0.734786 |
12 | 0.575983 | 0.707888 |
13 | 0.552943 | 0.683528 |
14 | 0.532413 | 0.661376 |
15 | 0.513977 | 0.641145 |
16 | 0.497309 | 0.622591 |
17 | 0.482146 | 0.605506 |
18 | 0.468277 | 0.589714 |
19 | 0.455531 | 0.575067 |
20 | 0.443763 | 0.561435 |
21 | 0.432858 | 0.548711 |
22 | 0.422714 | 0.536800 |
23 | 0.413247 | 0.525620 |
24 | 0.404386 | 0.515101 |
25 | 0.396070 | 0.505182 |
26 | 0.388244 | 0.495808 |
27 | 0.380863 | 0.486932 |
28 | 0.373886 | 0.478511 |
29 | 0.367278 | 0.470509 |
30 | 0.361007 | 0.462892 |
(これ以上の数のr表については、http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/rtable.htmlに掲載されています。)
なので、ピアソンの相関係数を計算したら、これを参照して有意差があるか判断すればいいわけです。
ピアソンの相関係数のおさらい
以前から使っている私のiPhoneでの歩行データをまた使ってみます。次の図は1ヶ月間の私の1日あたりの歩数と歩行距離を、さらに曜日ごとに分けて列挙しました。

ここで、
=pearson(B2:B31,J2:J31) |
と入力すると、1ヶ月間の毎日の歩数と距離とのピアソンの相関係数が出てきます。ここでは、歩数と距離の相関係数が0.994948となりました。
では、これが有意な相関か見てみましょう。上のr表のn=30の欄を見てみると、α=0.01でも0462892なので、p < 0.01のレベルで有意な正の相関とわかります。
というわけで、各曜日の相関係数を見てみましょう。曜日によって、n=4, 5とサンプルサイズが変わりますので、r表の参照部位が変わります。

いずれの曜日も相関係数が0.97以上と高いですね。
少し意外だったのが、大した差ではないのですが、一番歩数が多い火曜日が一番相関係数が低く、p > 0.01となりました。歩行速度の変化が大きいせいで、歩数と一歩あたりの移動距離に変化が大きいのでしょうか。
まあもっとも、サンプルサイズが小さすぎてなんとも言えませんが・・・。
参考url
・相関係数についての詳しい解説あり。
http://kusuri-jouhou.com/statistics/soukan.html
・相関係数検定表
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/rtable.html
この記事へのコメント