その統計解析結果を論文でどう表現する?-論文に書く際のガイドライン

統計解析について、データに対して適切な統計手法を用いることが非常に重要ですが、その結果をいかにして報告するか、というのも非常に重要になります。論文を読む際、よく「p値が有意水準(0.05未満)を満たしているかどうかばかりを見てるだけではダメ」というように言われますが、では何をどのように見るべきか、逆に、何をどのように論文中に報告すればいいかを知ることは重要です。しかしなかなかそれが難しい。

そんな中で、私が論文作成の際に参考にしているのが、この本です。


単なる統計解析手法の解説書ではない

統計の本といえば、t検定や相関分析などの各解析手法の意味や理論の解説と、それを実際に(特定のソフトを利用するなりして)解析する方法の解説、解析結果の読み取り方の解説がなされます。私も普段SPSSを用いて解析するにあたり、SPSSに関するそのような本を参照しています。

この本は、そもそもの目的がそのような本とは異なります。タイトルの通り、「医学論文を作成する際の、医学統計の表現の仕方のガイド」になっています。

そのことを、第1章の冒頭からまざまざと思い知らされます。例えばこの一文。

標本サイズが100を超える場合はパーセンテージを小数点以下1桁まで表示し、100未満の場合は整数で表示する。標本サイズが20に満たなければ、パーセンテージではなく実際の数値を示すことを検討する。

一文と言いながら二文でした。
この本を読むまで、なんとなく、どのように表現するかを選んでいましたし、publishされている論文を見ていて、表記の違いを気にしたりしていましたが、このようにしっかりガイドラインがあることを知りませんでしたし、いろんな論文を読んでいると、メジャー雑誌以外では全然こうなっていない論文がちらほら・・・。高校生ですら、データの精度に合わせて有効数字を意識するのですから、医学論文においてもこのようなルールを意識することは、研究者の端くれとして、正確にものを伝える(あるいは不正確さを正確に伝える?)上で重要なことですね。

統計解析結果の記載方法にも、当然ガイドしてくれます。例えば、回帰分析の結果を論文にする際、どのように記載するか実例が示され、そしてそれをtableやfigureとしてどのように表現するか、も実例と共に解説しています。自身が行った解析の結果と照らし合わせて、必要十分な表記を、迷わず作成する手助けになります。

日本語版は、当然記載などが日本語だけで記されていますので、最近英語版も欲しくなってきました。

ガイドラインという原則、例外は・・・?

ガイドラインという原則に対し、やはり例外はあるようです。
例えば、

近似的正規分布は、平均値と標準偏差で記述することができ、他の分布は中央値と範囲または四分位範囲で記述する方がよい

という非常に基本的な原則があります。
これに対し、これは以前あるメジャージャーナルに投稿された方が言っていたことなのですが、データに正規性がなかったためノンパラメトリック検定を行ったので、データを中央値と四分位範囲で表現して投稿したところ、reviewerから、「わかりにくいので平均値と標準偏差で表現するように」と言われたそうです。メジャージャーナルですので、統計の専門家もreviewerの1人に入っていたそうですが、状況に合わせて例外的な対応が必要なこともあるようです。


統計の報告に関するガイドラインとして、論文執筆の際に非常に大きな助けになる本ですが、それだけでなく、根本的な統計に関する知識も得ることのできる本になっていると感じています。

大学院生には必須の本では?とまで感じてしまいます。
スポンサーリンク



人気ブログランキングへ

この記事へのコメント

スポンサーリンク