mean±SD/SEかBox plotか

これだけ皆さんにボロクソに言われ、さらに擁護の誰もサポートしないのに頑張りますね。驚嘆すべきことですね。

複数のデータが得られたとき、グラフで表示するのは平均値プラスマイナス1標準偏差あるいは標準誤差(men±SD/SE)で表示することがこれまで多かった。しかし、最近の高校数学では箱ひげ図(Box plot)で教えているようだ。つまり最大値・最小値・第1四分位数、中央値、第3四分位数+平均値で示す。どちらがいいかというと後者の方が情報量が多いからいいのかもしれない。しかし、管理人のようなジジイはmean±SDのほうがなじみがある。

昔、大学院時代に一緒に実験した外国人研究者(教授)からmean±SEのほうがばらつきが小さく見えるから、こっちのほうがいいと教わった。統計学者でないとこんな感覚なのさ。

統計学を教える先生とどっちかに統一する?と話したのだが、特にどっちと決めなかった。SPSS などを使う場合が多いが、SPSSやSASは高価で学生の身分では自宅では使えない。R もいいけど、コマンドラインで入力する(?)よく知らないから当方にはちと敷居が高い(お勉強が嫌いだ)。

高度な統計計算をするわけではないのなら R よりGUIに近い自宅のPCに必ずあるExcel のほうがいいと思っているけど、時代遅れか?澪標さんから一言あるでしょうね。

PubMed でiPS cells で検索して出てきたtop20の英語論文をざっとみたところ、棒グラフで表現する場合は、すべてがmean±SD/SE で箱ひげ図で表示している論文はなかった。学部学生だったら Excel でmean±SDの棒グラフが描けるように教えるのが、いいのではないだろうか?

そういえば、標本の大きさ(いわゆるサンプルの数)が大きいとSDが大きくなると、堂々とおっしゃった医師がいましたな。


白にピンクの縁取りのバラです。きっと品種に名前があるのでしょうけど不明です。Hybrid Tea Rose ‘Honore de Balzac’なんだろうか。