高校数学で語るp値(後編)

前回に引き続き、高校数学でかたるp値後編。 前回はとりあえず、ごくごく簡単な例で、p値ってこういう感じというのを高校数学でわかる例でみてみました。今回はその例を応用して、p値の注意点と効果量についてがテーマです。 目次 前編の例のおさらい サンプルサイズと検出力 p値の注意点と効果量 サンプルサイズ設計 関連記事 前編の例のおさらい 後編の本題に移る前に、前編の例を再掲しておきます。 イカサマコイン例1あるコインを10回投げたところ、表が2回、裏が8回出るという結果になった。このコインは裏の出やすいイカサマコインか? これを仮説検定する場合、帰無仮説は 帰無仮説:このコインはイカサマコインではない(=確率0.5でそれぞれ表裏が出る) となり、今回のp値は「10回中表が2以下しか出ない、または裏が2回以下しか出ない」という状況の確率として以下のように計算されます。 p=2×(10C2+10C1+10C0)×(0.5)10=0.1093 ということで、p値が0.05を下回りませんでした。10回中2回しか表が出ない、というのは、普通のコインでもそこそこ起こることなので、このコインはイカサマコインとは言えないわけでした。 スポンサードリンク サンプルサイズと検出力 …

続きを読む

高校数学で語るp値(前編)

昔、高校生からp値ってなに?と聞かれたことがあり、その時に話したことを修士の大学院生に説明すると、意外と受けがいいことがあるので、そろそろ高校数学を忘れている自分の備忘録として(笑) 高校レベルの数学で理解できる内容にするため、実際に統計で行なっている検定とは異なる例をあげていますが、とりあえずp値ってどんなものかがわかるようにしたものですので、ご了承ください。 目次 帰無仮説と対立仮説 p値は帰無仮説下でその出来事(+よりレアなこと)が起こる確率 高校数学で語るp値-このコインはイカサマコインか? 関連記事 スポンサードリンク 帰無仮説と対立仮説 医学の世界では、新薬の有効性を調べる、などの研究を行う際、新薬を投与した群と偽薬を投与した群とで結果がどう異なるかを調べて評価するわけですが、両群で見られた結果の差が「偶然起こった差ではないだろう」ということを評価するために、仮説検定という立場をとります。簡単にするため、以下は新薬投与群と偽薬投与群という2群に対する評価を行う場合について書いていきます。 新薬投与群と偽薬投与群で、仮に新薬投与群の方が良い結果となる人の割合が高かったとします。その割合の違いは、新薬が本当に有効なので起こった違いなのでしょうか?それとも、同じ程度だけど単なる誤差として起こったことでしょうか? 仮説検定では、「新薬と偽薬に差はない(=両群の結果の差は…

続きを読む

統計メモ メニュー

エクセルで統計処理 出先でエクセルで簡単な統計解析を行う–記述統計量、t検定、相関係数 相関係数の有意差の有無を知る–相関係数検定表 多重比較を考える 多重比較-なんのため、どんな時に行う? 多群間比較での多重比較-One-way ANOVA後のpost-hoc test 複数の相関を調べた時の多重比較-BonferroniとFDR 【お遊び】多群間比較の多重比較にBonferroni法やFDR法を用いてみる 多変量解析 因子分析の抽出法・回転法 心理検査を考える 検査の信頼性の評価 高校数学で語る統計 高校数学で語るp値(前編) 高校数学で語るp値(後編) その他 統計解析結果の論文での書き方(ガイドライン) わかりやすい医学統計の報告-医学論文作成のためのガイドラインposted with ヨメレバ大橋靖雄 中山書店 2011-08-19 AmazonKindle楽天ブックス楽天kobo 少し統計に関するメモが増えてきたので、私自身の検索効率向上のためにメニューを作成しました。統計について身につけるためには、教科書的な勉強の他に、実際に知りたい検定を行っている論文を読んでみること、試しに自分の手持ちのデータでやってみること、が大切だと思っています。そのようなメモを続けられたらと思っています。

続きを読む

【お遊び】多群間比較の多重比較にBonferroni法やFDR法を用いてみる

今回は興味本位にやってみた実験です。 前回(複数の相関を調べた時の多重比較-Bonferroni法とFDR法)、Bonferroni法はαエラーを少なくするために非常に保守的なため、統計的有意差が出なかった場合に、「帰無仮説は棄却されない」ではなく、「帰無仮説の棄却は保留」と考えるべき、と記述しました。では、FDR法とBonferroni法では、どれくらいの差があるのでしょうか。 そのために、前々回(多群間比較での多重比較-One-way ANOVA後のpost-hoc test)行った多群間比較での多重比較をBonferroni法とFDR法で行ってみて、Tukey-Kramer法での多重比較と結果がどう違うかを見てみたいと思います。 目次 前々回のデータのおさらい:ANOVAからpost-hoc test t検定の繰り返しの結果をBonferroni法、FDR法で補正 多く使われている方法を使いましょう 関連記事 スポンサードリンク 前々回のデータのおさらい:ANOVAからpost-hoc test 前々回、各曜日での歩数の違いを7群間で比較するのに、1.One-way ANOVAで7群の間に違いがあることを調べてからpost-hocとしてTukey-Kramer法で多重比較、2.7C2=21組のペアの違いをt検定を21回繰り返し検定、という2つの方法を行って比べま…

続きを読む

複数の相関を調べた時の多重比較-BonferroniとFDR

前回(多群間比較での多重比較-One-way ANOVA後のpost-hoc test)は多群間比較の際の多重比較を確認しました。一方で、多重比較は前々回(多重比較-なんのため、どんな時に行う?-)も述べたように、ANOVA後のpost-hoc以外の場面でも、複数の検定を行った場合に常に意識しなければならないものでした。例えば、「複数の変数の相関を調べる」という場面があり、前々回紹介した論文には「161個もの相関係数を調べたため多重比較した」というものもありました。 このような場面では、t値やF値を利用せず、p値をそのまま利用して多重比較を調整するBonferroni法、False Discovery Rate(FDR)法が利用しやすく、よく用いられています。 比較的簡単に運用できる多重比較なのですが、欠点もあることを認識しておく必要があります。実例を見ながら両者の特徴を見てみましょう。 目次 ごく単純にできるBonferroni法 少しの工夫でできるFDR法 7つの相関係数を調べる 実例:Bonferroni法による多重比較 実例:FDR法による多重比較 Bonferroni法とFDR法、どちらを用いる? 関連記事・参考文献 スポンサーリンク ごく単純にできるBonferroni法 Bonferroni法はごく単純で、検定数がNだった場合、有意水準…

続きを読む

多群間比較での多重比較-One-way ANOVA後のpost-hoc test

前回(多重比較-なんのため、どんな時に行う?)の続き。 複数の検定を行う際には、FWE rateが上昇するため、多重比較を行う必要がありました。最も典型的なパターンが、3群以上の群間比較を行う場面です。 例えば、AとBとCの3群について、全ての2群の組合せで群間比較を行った場合、A vs B、B vs C、C vs Aという3回の統計を行うことになるため、仮に3群に有意差がなくてもこの3つの統計のうち少なくとも1つのp値が0.05となってしまう確率は、 3回検定を行い、少なくとも1つが偶然p=0.05となる確率1-(1-0.05)3=0.14 と14%程度の確率で起こってしまうことになっていました。これを正しく有意水準0.05で抽出するために、多重比較を行う必要がありました。 今回は、このような多群比較を行う際によく用いられる、 One-way ANOVA後のpost-hoc testを行う によって、多群における2群間比較を全てStudentのt検定で行った場合とどう結果が変わるかを見たいと思います。 目次 7群の多重比較をする–ANOVAからpost-hocへ 21個の検定を個別にStudentのt検定で行うと 注意 関連記事・参考文献 スポンサーリンク 7群の多重比較をする–ANOVAからpost-hocへ 以前の相関係数につい…

続きを読む

多重比較-なんのため、どんな時に行う?-

扱うデータが膨大になり、多重比較補正が統計解析の嗜みとして当たり前になっています。 その反面、なぜ多重比較補正をしなければならないのかがよくわかっていない、という院生が多いように感じます。 今回はなぜ多重比較補正をするのかを簡単にまとめつつ、実際に多重比較補正を行なっている論文の例を挙げていきます。 目次 familywise errorとは 多重比較を行う場面 各種の多重比較補正を行なっている論文の例 年々多重比較補正を行っている論文数は増加 関連記事 スポンサーリンク familywise errorとは 統計を行う上で、多重比較の問題を扱う必要があることがあります。例えば、有意水準をα=0.05に設定し、3つの検定を行ったとして、帰無仮説を仮定した上で、その3つの検定のうち少なくとも1つのp値が0.05となる可能性は、 3回検定を行い、少なくとも1つが偶然p=0.05となる確率1-(1-0.05)3=0.14 と、実際に差がなくても14%の確率で起こるわけです。このように、検定を繰り返した結果、全体として何らかの帰無仮説を棄却する結果が出てαエラーが増大することをfamilywise error(FWE)と言います。 最近の研究では、その評価項目は多岐にわたるため、10以上の項目について検定を行い、p値を求めていることは非常に多いため、F…

続きを読む

因子分析の抽出法・回転法

因子分析(factor analysis)は、多変量データに潜む共通因子を探る手法になります。多くの項目からなるデータを少数の説明要因にまとめることが目的です。 心理系の研究では、多くの項目からなるアンケートデータから因子を見出す、ということが行われることがあります。そのような時に用いるのが因子分析です。 因子分析をする場合には、抽出法と回転法を選択する必要があります。それぞれ、 抽出法:共通性を推定=因子を決定 回転法:因子負荷量を算出 という独立した過程になります。 抽出法の選択 因子分析の抽出法には主に最尤法(method of maximum likelihood)、最小二乗法、主因子法、主成分法などがあります。この中で最も良い推定が可能なのが最尤法なので、基本的には抽出法は最尤法を用いるべきなようです。 しかし、最尤法はその精度ゆえに、不適解を出す可能性も高いようです。不適解かどうかの判断は、共通性が1以上の項目があるか、によります(因子分析では共通性+独自性=1という基本性質があるため)。 このような不適解となる代表的な理由として、サンプルサイズが小さい、局所的に相関が高い項目がある、項目数が多い、ということがあげられるようです。これについては、因子分析に限らず、多変量解析をうまくするために考慮すべき事項といえます。ですので、このような場合は、サンプルを増やす、項目を減らす、ということをまず考えるべきなようです。 それ…

続きを読む

検査の信頼性の評価

級内相関係数と一致係数の使い分け ある検査の信頼性を評価するには、その検査の結果がどのような数値を取るか、評価者内での再現性と評価者間の信頼性のどちらを評価したいのかで、用いる検定が変わってきます。 検査の結果が取る数値が 連続尺度・・・エーベルの級内相関係数:ICC(Ebel's intraclass correlation coefficient)順序尺度・・・ケンドールの一致係数:W(Kendall's coefficient of concordance)名義尺度・・・コーヘンの一致係数:κ(Cohen's coefficient kappa) さらにICCでは、評価者内信頼性(intra-rater reliability)か評価者間信頼性(inter-rater reliability)かで以下のように使い分けます。 1人の評価者が複数回評価した時の評価者内信頼性・・・ICC(1,1)1人の評価者が複数回評価した時の評価平均の信頼性・・・ICC(1,b)bは評価した回数複数の評価者が1回評価した時の評価者間信頼性(変量モデル)・・・ICC(2,1)複数の評価者が1回評価した時の評価平均の信頼性(変量モデル)・・・ICC(2,b)複数の評価者が1回評価した時の評価者間信頼性(母数モデル)・・・ICC(3,1)複数の評価者が1回評価した時の評価平均の信頼性(母数モデル)・・・ICC(3,b)bは評価者の人数 変量モデルは、多くの人間の中のたまたまb人を取り出して評価…

続きを読む

相関係数の有意差の有無を知る–相関係数検定表

以前、エクセルで簡単な統計解析を行う方法を紹介した際に、ピアソンの相関係数を求める関数を紹介しました。 =pearson(配列1, 配列2)引数引数に指定する値配列11つ目のデータ配列配列22つ目のデータ配列2つの配列について、Pearsonの相関係数を返す ではこの相関係数が有意なものなのかは、どう求めるのでしょうか。エクセルで計算していってもいいのですが、楽なのは「相関係数検定表」を参照することです。 *当然、普段はSPSSで一括して行っています。テーマは「SPSSのないで先の環境でふっと思いついた統計解析をエクセルで行う」です。 相関係数検定表(r表) 相関係数検定表(correlation coefficient r table: r表)とは、各サンプルサイズnに対して有意水準α(両側確率)となるピアソンの相関係数の絶対値を示した表のことです。 例えば、サンプルサイズ30までのr表を示します。 sample sizensignificance level: α (two-tailed probability)0.050.0130.9969170.99987740.9500000.99000050.8783390.95873560.8114010.91720070.7544920.87452680.7067340.83434290.6663840.797681100.6318970.764592110.6020690.73…

続きを読む

スポンサーリンク