因子分析の抽出法・回転法

因子分析(factor analysis)は、多変量データに潜む共通因子を探る手法になります。多くの項目からなるデータを少数の説明要因にまとめることが目的です。 心理系の研究では、多くの項目からなるアンケートデータから因子を見出す、ということが行われることがあります。そのような時に用いるのが因子分析です。 因子分析をする場合には、抽出法と回転法を選択する必要があります。それぞれ、 抽出法:共通性を推定=因子を決定 回転法:因子負荷量を算出 という独立した過程になります。 抽出法の選択 因子分析の抽出法には主に最尤法(method of maximum likelihood)、最小二乗法、主因子法、主成分法などがあります。この中で最も良い推定が可能なのが最尤法なので、基本的には抽出法は最尤法を用いるべきなようです。 しかし、最尤法はその精度ゆえに、不適解を出す可能性も高いようです。不適解かどうかの判断は、共通性が1以上の項目があるか、によります(因子分析では共通性+独自性=1という基本性質があるため)。 このような不適解となる代表的な理由として、サンプルサイズが小さい、局所的に相関が高い項目がある、項目数が多い、ということがあげられるようです。これについては、因子分析に限らず、多変量解析をうまくするために考慮すべき事項といえます。ですので、このような場合は、サンプルを増やす、項目を減らす、ということをまず考えるべきなようです。 それ…

続きを読む

New England Journal of Medicineによる医学教育ビデオ

医療においては、侵襲的な処置を行うことが当然ありますが、誰もがその侵襲的な処置を初めて行う、という場面があります。それまでにはもちろん、指導医の処置を見たり、専門書で処置についての知識を得たり、シミュレーターで練習したり、と準備をするわけですが、最近はビデオの存在がかなり大きいと感じています。 私も研修医時代、腰椎穿刺やグラム染色、挿管などをyoutubeで検索しては繰り返し見て、そして実際に行う、ということをしていました。 先日、興味本位でyoutubeで「腰椎穿刺」と検索すると、トップに出てきたのはなんとNEJMの監修によると思われる腰椎穿刺ビデオでした。 その中では、腰椎穿刺の手技だけでなく、穿刺そのもの以外の準備や、穿刺の際に針が通過する組織、穿刺禁忌を見抜く方法、有害事象など、非常に丁寧な作りの教育ビデオになっていました。 そこで、実際にNew England Journal of MedicineのHPを見てみますと、同じようなビデオが多くアップロードされていました。なんと、血圧の測り方(自動測定ではなく、水銀柱と聴診器を用いた測定法。高血圧の定義の解説まで!)など、非常に基本的な項目まで! http://www.nejm.org/multimedia/medical-videos 英語の発音も非常に綺麗なので、聞き取りやすく、リスニングの勉強にもなり、おすすめです。 ちなみに、腰椎穿刺ビデオの中で、初圧を図る際に、穿刺針と圧棒を連結するのに、"f…

続きを読む

その統計解析結果を論文でどう表現する?-論文に書く際のガイドライン

統計解析について、データに対して適切な統計手法を用いることが非常に重要ですが、その結果をいかにして報告するか、というのも非常に重要になります。論文を読む際、よく「p値が有意水準(0.05未満)を満たしているかどうかばかりを見てるだけではダメ」というように言われますが、では何をどのように見るべきか、逆に、何をどのように論文中に報告すればいいかを知ることは重要です。しかしなかなかそれが難しい。 そんな中で、私が論文作成の際に参考にしているのが、この本です。 わかりやすい医学統計の報告-医学論文作成のためのガイドラインposted with ヨメレバ大橋靖雄 中山書店 2011-08-19 AmazonKindle楽天ブックス楽天kobo 単なる統計解析手法の解説書ではない 統計の本といえば、t検定や相関分析などの各解析手法の意味や理論の解説と、それを実際に(特定のソフトを利用するなりして)解析する方法の解説、解析結果の読み取り方の解説がなされます。私も普段SPSSを用いて解析するにあたり、SPSSに関するそのような本を参照しています。 この本は、そもそもの目的がそのような本とは異なります。タイトルの通り、「医学論文を作成する際の、医学統計の表現の仕方のガイド」になっています。 そのことを、第1章の冒頭からまざまざと思い知らされます。例えばこの一文。 標本サイズが100を超える場合はパーセンテージ…

続きを読む

PubMedを活用する

論文検索にPubMedを活用しているかと思いますが、PubMedを用いたちょっとした小ネタを3つ。 advanced search 年別論文出版数の抽出 検索結果のリストをダウンロード advanced search これはpubmed検索の王道ですが、その名の通り、色々と指定して高度な検索を行う方法です。幾つかやり方はあるようですが、私はあまり慣れていないので、素直に直感的にわかりやすい方法でしています。 まず、PubMedのトップページに行くと、普段キーワードを打ち込んでいる検索枠の真下に、"advanced"というリンクがあるので、そこをクリック。 すると、次の画面では、検索キーワードがどのような属性かを指定できるプルダウンメニューつきの検索枠が出てきます。しかも、 ANDなどの演算子で複数のキーワードを組み合わせた検索も指定できます。 ひとまず、メジャーなキーワードで検索してみましょう。例えば、titleにAlzheimerを含む論文を検索してみます。 すると、当然このように膨大な数のAlzheimer病関連の論文が抽出されます。 年別論文出版数の抽出 学会発表などでたまにintroductionとして、ある疾患が近年どれくらい注目されているかを表現する方法の一つとして、「年々この疾患の論文が増えてきている」というのを棒グラフに表しているプレゼンを目にすることがあります。これはどう作っているのでしょう。実は、出版数の多い疾患の場合、Pu…

続きを読む

今更英会話勉強-英単語リスニング編:mikan-

今年も年末に国際学会でoral presentationを予定しています。昨年までも国際学会では発表をしていたのですが、学会の規模がそれほど大きくなく、発表、質疑含めて10分程度をやり過ごすだけ、と思い、あまり英会話の勉強をしてきませんでした。しかし、今年はやや学会の規模が大きく、発表時間が長いかも・・・という状況になったため、付け焼き刃ですが英会話の勉強を始めることにしました。 しかし、大きな問題があります。私は比較的人見知りな上、電話などでのコミュニケーションが特に苦手なため、例えばskypeでnativeの人と会話するような形式のサービスはハードルが高いのです。コンスタントに勉強を続けていく上で、このようなハードルができる限り低いことは非常に重要です。 そこで、一人でチマチマできることはないか、まずはiPhone、iPadアプリで何かないか探し始めました。ひとまず今の私にとって大事なことは、 一人でチマチマ手軽にできる まずは苦手なリスニングを強化できる 最初なのであまりお金はかけずに試してみたい という条件でした。2週間ほど前から使い始めたのがこのアプリ。 英単語アプリ mikan 開発元:mikan Co.,Ltd. 無料 posted with アプリーチ …

続きを読む

検査の信頼性の評価

級内相関係数と一致係数の使い分け ある検査の信頼性を評価するには、その検査の結果がどのような数値を取るか、評価者内での再現性と評価者間の信頼性のどちらを評価したいのかで、用いる検定が変わってきます。 検査の結果が取る数値が 連続尺度・・・エーベルの級内相関係数:ICC(Ebel's intraclass correlation coefficient)順序尺度・・・ケンドールの一致係数:W(Kendall's coefficient of concordance)名義尺度・・・コーヘンの一致係数:κ(Cohen's coefficient kappa) さらにICCでは、評価者内信頼性(intra-rater reliability)か評価者間信頼性(inter-rater reliability)かで以下のように使い分けます。 1人の評価者が複数回評価した時の評価者内信頼性・・・ICC(1,1)1人の評価者が複数回評価した時の評価平均の信頼性・・・ICC(1,b)bは評価した回数複数の評価者が1回評価した時の評価者間信頼性(変量モデル)・・・ICC(2,1)複数の評価者が1回評価した時の評価平均の信頼性(変量モデル)・・・ICC(2,b)複数の評価者が1回評価した時の評価者間信頼性(母数モデル)・・・ICC(3,1)複数の評価者が1回評価した時の評価平均の信頼性(母数モデル)・・・ICC(3,b)bは評価者の人数 変量モデルは、多くの人間の中のたまたまb人を取り出して評価…

続きを読む

エクセルで全体データから特定IDのデータのみを抽出

研究をやっていると、非常に大きなデータセットの中の一部だけを取り出してサブ解析をしたいことがあります。そういう時に、そのサブグループかどうかを示す変数があり、それをソートするだけで取り出すことができるようになっていれば一番楽なのですが、時に、サブグループについて全体での通しIDだけしか分かっておらず、そこから抽出しなければならないことがあります。数例だけならIDを検索してコピペすれば済む話ですが、2000や3000以上の症例数のデータセットから100や200のランダムなIDの症例を引っ張ってこようと思うと骨が折れます。 そこで、エクセル上で、IDだけを入力すれば、あとは自動でそのIDのデータを引っ張ってきてくれるような表を作ってしまいます。 大まかな流れ:膨大なデータから必要な日付のデータだけを抽出するmatch(検査値, 検査範囲, 照合型)関数index(範囲, 行番号, 列番号)関数注意点:欠損値の取り扱い 大まかな流れ:膨大なデータから必要な日付のデータだけを抽出する 今回はmatch関数とindex関数を用いて、 のような日付ごとの歩行距離、階段を上った階数、歩数の一覧表から、特定の日付のデータのみを抽出することを考えます。 目標は、 のH2セルに日付を入力すると、上の表から自動的にデータを拾ってきて、 となるようにすることです。 大まかな流れは、 match関数で知りたいID(今回は日付)が何行目か求めるindex関数…

続きを読む

相関係数の有意差の有無を知る–相関係数検定表

以前、エクセルで簡単な統計解析を行う方法を紹介した際に、ピアソンの相関係数を求める関数を紹介しました。 =pearson(配列1, 配列2)引数引数に指定する値配列11つ目のデータ配列配列22つ目のデータ配列2つの配列について、Pearsonの相関係数を返す ではこの相関係数が有意なものなのかは、どう求めるのでしょうか。エクセルで計算していってもいいのですが、楽なのは「相関係数検定表」を参照することです。 *当然、普段はSPSSで一括して行っています。テーマは「SPSSのないで先の環境でふっと思いついた統計解析をエクセルで行う」です。 相関係数検定表(r表) 相関係数検定表(correlation coefficient r table: r表)とは、各サンプルサイズnに対して有意水準α(両側確率)となるピアソンの相関係数の絶対値を示した表のことです。 例えば、サンプルサイズ30までのr表を示します。 sample sizensignificance level: α (two-tailed probability)0.050.0130.9969170.99987740.9500000.99000050.8783390.95873560.8114010.91720070.7544920.87452680.7067340.83434290.6663840.797681100.6318970.764592110.6020690.73…

続きを読む

論文作成Tips メニュー

論文の投稿先 精神科の症例報告を掲載する英文ジャーナル-妄想性障害の場合 論文の下準備 論文執筆への意識改革 PubMedの活用:検索結果リストのダウンロード等 文献管理、reference作成ソフト・Mendeley 論文の書き方 論文原稿の書式設定雑論 Wordの用紙の向きを途中で変更する -ハイフン、−マイナス、–ダッシュ howeverとbut-長い複文を分割して分かりやすくする 統計結果の書き方(ガイドライン) Figureの書き方、Power Pointの使い方 figure作成における大きさと解像度 パワポを使って高解像度figureを作成する エラーバー付き棒グラフをエクセルで作る@Excel for Mac Version 16 エラーバー付き棒グラフをエクセルで作る(旧Excel for Mac版) Excelで回帰直線つき散布図を作る Tableの書き方、Excelの使い方 表の脚注—脚注記号の入力など SPSSの統計解析結果からExcelでテーブルを作成 エクセルの数値を指定桁数の文字列に変換 エクセルで特定IDのデータを抽出(サブグループ解析の準備) Excelのピボットテーブルを使ってデータ集計する Mac Tips 数学記号の入力方法 Macでスクリーンショットを撮る 便利な外部サイト Index Medicus検索 海外医学雑誌投…

続きを読む

エラーバー付き棒グラフをエクセルで作る

Excel for Macのバージョンアップに合わせて、新しい記事を投稿しました。 統計解析結果のグラフでは、平均値に標準偏差を一緒に表したエラーバー付きの棒グラフが用いられることが頻繁にあります。そんなエラーバーをエクセルで作ったグラフに表示する方法をまとめます。 目標はこんなグラフを作ることです。 目次 普通にグラフを作る エラーバーの範囲(誤差範囲)を設定 95%信頼区間や四分位点にも応用可能 自分の歩行データを眺めてみて 関連記事 スポンサーリンク 普通にグラフを作る まずはデータの準備です。今回は、以前紹介したiPhoneのヘルスケアアプリからエクスポートした私の歩行データを用いたいと思います。 1ヶ月間の一日あたりの歩数データについて、曜日ごとに平均・標準偏差を計算し、下の図のように表にしておきます。なお、平均や標準偏差などの記述統計量をエクセルで求める方法は、以前紹介した通りです。 この中から、まずは平均値と曜日名のセルだけ選んで、普通に棒グラフを作ります。 エラーバーの範囲(誤差範囲)を設定 できたグラフをクリックすると、「グラフレイアウト」メニューが出てくるので、それをクリック。「誤差範囲」をクリックして、プルダウンされた中から「誤差範囲のオプション」を選びましょう。 出てきたウインドウ…

続きを読む

スポンサーリンク