実習レポートでは学生が引用する教科書は限られており、また学生は教科書の記述を要領よくまとめて、実習の結果を説明できるわけではないので、教科書の記述を書き写した金太郎飴のレポートになる。
コピペ検索ソフトを使っているわけだが、その類似度の%はあてにならない。さすがに一致した文章があると検出して高い類似度になるが、一部を変更したり、順番を変えたり、受け身を能動に変えたとかは検出しにくい。だからどのレポートを比較するかを、類似度の%の高さで参照するわけだ。また、全く類似していないレポートも調べる。メール添付の電子媒体で提出されたレポートで、コピペを判定すると宣言しているので、紙媒体のレポートは、友人のレポートのコピペだが、電子媒体のほうは全く関係ない文書を送ってくる奴がいるからな。
レポートの考察が、電子的なコピペではなく、教科書の記述をちょっと変えた、手打ちのコピペになってしまった類似度が高いレポートを一概にコピペだといって評価を低くするのは、まだ1年生なのでちとできない。実験結果を、「教科書の説明を引用して説明する」というのが考察だといっても、まだできない。
金太郎飴のレポート100通を採点するのは、気が狂いそうな作業だ。ほんの少し、1通か2通、気の利いたオリジナルのレポートがある。それを見出すだけで、気が狂いそうになる。丸1日で終了しない作業だ。だから、一部にでも気の利いた考察があると、他はどうでも、高い評価を与えちゃう。
中には、あきらかな専門用語の使い方の間違いがある。教科書の記述を写していると思われるのだが、教科書には該当していないので書いてあるはずがないと重われる用語が複数の学生のレポートにでてくる。同じ教科書を引用している。
この場合、誤った用語を使って一人の学生がレポートを作成し、これを、そのままではなく、少し順番や てにおは を変えて、打ち直したか、教科書の記述が謝りだったのかのどちらかだ。
ではこのようなキーワードで複数のファイルから検索するのは、現在使っているコピペ判定ソフトではできない。WideGrepExpressというのを試してみた。100通のレポートから、あるべきではない専門用語で検索したら、二人のレポートにでてきた。これで、この二人はつるんでレポートを作成したことがわかる。ほかにも、だれかが間違えて、リソソーム をリドソーム なんてレポートに書いてきたら、この単語で、このソフトで検索すると、この単語を使ったレポート抽出できるわけだ。レポートのコピペに対しての用途は限定されるかもしれないが、役にたちそうだ。
grep とはUnixのコマンドで一致する文字列を検索せよという命令だ。