チャンピオン・データ

チャンピオン・データという言葉がある。同じような実験を行い、多くのデータがあるとき、自分の主張を最もよく反映する生データのことである。
ゴミ、ノイズがない、電気泳動レーンがまっすぐだ、1枚のゲルシートで表したら格好がいいのだが、そのように再度電気泳動することができないから、たまたまレーンが好都合に並んでいる、コントラストが比較すべき図と同じだ、目的のバンドがくっきりでている…などなどの基準を満たす本人の思う綺麗な生データというのはなかなか採取できないことが多い。そこで、主張にぴったりあった綺麗な写真などの生データをチャンピオン・データと呼ぶのだ。正しいかどうかとは別で、本人の主張に最もよく合致したと思う綺麗な図のことだ。
管理者が学生のころ、こういう言葉はなかったし、管理者の分野では電気泳動は主たる方法ではなかった。それでも、論文や発表のスタイルは、まず写真やペンレコーダの生データを提示し、そのどこの部分をどのように測定したかを示し、複数の測定結果をまとめたグラフで提示するのが普通だ。つまり定性的と定量的な結果の表示が基本であったし、いまでもそうだ。最初に提示する生データがばっちいと同業者に信用してもらえない。だから綺麗なデータを取ることに懸命になるわけだ。
生データとして綺麗な最も反応の大きかった生データがチャンピオンデータになるわけで、typical result として提示してしまうのだ。「反応だよ!」と強調したいから当然の行為だ。しかしこれは間違いなのだ。平均的な大きさの反応を示した生データがtypicalなのであって、最も反応の大きな綺麗なデータがtypicalなのではないのだ。でもチャンピオンデータを示したいわけで、この図のlegends にtypical result と書いてしまうのだ。
捏造で問題になって撤回された論文で、筆頭著者は博士論文で使った写真を流用した。「骨髄ー機械的刺激」だったのを「脾臓ー酸刺激」の結果として論文にしてしまったのだ。なぜかというと、彼女にとって、博士論文の図はチャンピオン・データだったからだ。だから、博士を終了した後のポスドクとして仕事をしているとき、研究室内セミナー等で議論するとき、この写真をパワポに仕込んだりしていたんだろう。当然ですな。写真をこういう結果を得た事があるとか、同じような結果が得られるだろうとか、プレゼン資料として使うのになんの問題もない。チャンピオン・データなので人に見せたいしね。
博士課程で得たチャンピオンデータは、いつ、どうやって、どのマウスから得たという付帯事項はしっかり頭にあるのが当然だ。取得できて嬉しかったわけで、実験ノートなんか見ることなしに記憶されている。だから他の実験結果として提示することなどありえないのだ。30年たったら忘れちゃうけど3年では完全に覚えている。これが自分で博士論文を書いたことのある基礎医学の研究者の共通認識だろう。だから11jigen氏が2014年2月14日に博士論文の図と一致していると指摘した時、管理者がそうだったように、ほとんどの博士論文を書いたことのある人は、これでSTAPはおしまいと思ったにちがいない。案の定、ぞろぞろ疑惑がでてきた。本人は、本当の図があるとか、ネットで指摘される前に本物と入れ替えることを申請したとか、パワポのファイルが混乱してしまった、執筆サポータが変わったとき、そのままになってしまった、などぐちぐち言い訳するが、ありえないことなのだ。
本人の頭の中で、パワポで説明しているうちに、新たな実験の結果になってしまったんだろ。「あの日」によると、よそ様に指摘されて、パニックになったようですな。本人は嘘をついていたという自覚はなく、本当だと思っていたのが、よそ様の指摘で思い出したからですな。どうして大学院時代のチャンピオン・データが新しい実験のデータに変換されてしまったのかは、推定はされているけど、本人も含めだれにもわからないでしょ。本人が意図して行ったとは思いたくないけど、結果が全てなんだから、なぜ流用されたかの理由にかかわらず、捏造とされてもしょうがない。この図だけでなく、他にもあるからね。
何年か前、ある論文の査読をしたとき、対照実験の生データが、同じ著者のすでに発表されている論文の図と同一であったのを見つけたことがある。査読は自分の専門分野の論文を査読するわけで、投稿した著者のこれまでの論文は手元にあり、すでに読んでいるからわかったのだ。対照、つまりなにも処置をしていないときの結果なので、異なった処置を行った論文で共通に使っても構わないかもしれない。しかし、別の論文だし、そうは書いてないし、legendsの記載も違うので、指摘したのだ。投稿者にとって、一番綺麗な図、チャンピオン・データだったんだよね。リバイスされた論文では、別の、多分本来の対照実験結果に変わっていたからacceptとしたのだ。この著者は管理者に感謝すべきだが、当然、管理者は匿名なので感謝されていない。リバイスされた論文を再度査読したときも、感謝の言葉はなかったな。これは対照実験なので、まだいいけど、例えば、発表された論文に薬Aの結果という図があって、全く同じ図が薬Bの結果として別の論文に表示されたら大変だ。捏造といわれてもしょうがない。
大昔の話なんだけど、ある日本人研究者が海外の研究室で実験していて、学会で口頭発表して、その発表が要旨として図とともに印刷されたのね。そしたら、隣の別の研究者からその図は俺のデータだというクレームがついた事がある。言い訳は、データが同じキャビネットにあったから、自分のデータと思って使っただって。同じようなパターンの図になるけど、全く違う実験の結果だよ。
[ 追記 ]
このブログを書き終わって、他のブログをみていたら「汚いデータ」という柳田充弘先生のブログが紹介されていた(408. Apfel 2016年02月18日 11:50)。ま、この場合は「汚い」といっても、それは、データとして汚いのではないから、このブログの綺麗なチャンピオン・データの逆のことではない。