レポートをAIが作ったと判定できるか?

【2025】今すぐ使いたい無料のAIチェッカー5選!引っかかった場合の対処法も解説 という記事に5つの判定サイトが紹介されています。テストしてみました。

材料はかつて学生実習で偉たデータです、これを示してChatGPTにレポートの作成を依頼してみました。
#### ###に挟まれたのがChatGPTへの依頼で、その結果(青字のレポートとなる部分)を以下の5つのサイトに入力して判定してもらいました。ChatGPTの作成したレポートは学部1年生の初めて実習レポートを書いた文章としたらほぼ満点に近いものです。実際には統計計算も行わせるのですが、統計計算による有意判定とかが間違えてなく、AIを使ったのではないとしたら満点をつけるレポートですね。

GPTZero
We are highly confident this text was AI generated
We’ve compared this text to other AI-generated documents. It’s similar to the data we’ve compared it to.
Probability breakdown
The probability this text has been entirely written by a human, AI, or a mix of the two.Most AI detectors are unable to differentiate between text that is either AI or human (e.g., 50% AI probability) or text that is a combination of AI and human (i.e., mixed output). That differentiation is made here.
89% AI generated  0% Mixed  11% Human
(*:学部1年生風に書けとしてその結果を入力したら 54% AI generated  0% Mixed  46% Human とは判定は変化した)

生成AIチェッカー
25% AI generated  0% Mixed  75% Human

Neural writer
このレポートは、非常に構造化されており、科学的な形式と専門用語を正確に使用しているため、AIによって生成された可能性が高いです。

isgen.ai
23% AI generated  0% Mixed  77% Human

Smodin
57% AI generated  0% Mixed  43% Human

100% AI作成文章なんですが、これらのチェッカーの成績は芳しくないですね。この例のように筋の通った文法的に誤りのない文章だと、逆にAIによるものだと当方は判断できますが、このAIの作成した文章に学生さんが加筆したりしたら判定できなくなります。ChatGPTに学部1年生らしく作れとか依頼する(*)と、判定はさらにむずかしくなります。

これらのチェッカーに学とみ子の書いた文章を入力すると100%人間が書いた文章と返ってきます(*2)。学とみ子の書く文章は文法も論理も日本語もメチャクチャなので、優秀なAIはこんなデタラメ文章を作るわけがないと判断するからですね。

###

Q: ある男女共学の大学の学生実習で1年生の2クラスで握力を測定しました。
1)男女で握力に差があるか
2)A,B2クラスの男同士、女同士で握力に差があるか
3)シャウト効果(声を出して力を出したときの効果)が男女で差があるか
を調べた。
下記は平均値±標準偏差で、有意差の有無の判定はStudentのT検定で3)は対応あり、1),2)は対応のない検定結果である。

1)男 47.8±11.6 kg n=62、女 32.6±7.3 kg n=31 p<0.001 有意差あり 2)男 Aクラス 48.9±12.3 kg n=30、Bクラス 46.7±10.8 kg n=32 p>0.05 有意差なし
女 Aクラス 32.5±7.8 kg n=17 Bクラス 32.8±7.0 kg n=14 p>0.05 有意差なし

3)男 発声なし 47.8±11.6 kg 発声あり 49.7±12.5 kg n=62 p<0.001(p=0.00013) 有意差あり 女 発声なし 32.6±7.3 kg 発声あり 33.6±7.6 kg n=31 p>0.05(p=0.078) 有意差なし

この結果でレポートを作成してください。

ChatGPT: 以下に、いただいた結果を基にした**レポート例(結果と考察を含む)**を作成します。
レポートとしてそのまま提出できるよう、**目的 → 方法 → 結果 → 考察 → 結論**の形式でまとめています。

# **握力測定実習レポート**
## 1. 目的
本実習では、大学1年生の男女学生を対象に握力を測定し、以下の3 点について検討することを目的とした。
1. **男女間で握力に差があるかを検証する。**
2. **A・B 2 クラス間で、男女それぞれの握力に差があるかを検証する。**
3. **発声(シャウト)による握力増強効果が男女で異なるかを検証する。**
## 2. 方法
某大学1年生のうち A・B の2クラスを対象に握力測定を実施した。
測定は左右いずれかの利き手で1回ずつ行い、その値を記録した。
また、発声の有無による差を調べるため、同一被験者において「発声なし」「発声あり」での握力を測定した。
統計学的検討として、
* **男女差・クラス間差(項目1・2):** 対応のない Student の t 検定
* **発声効果(項目3):** 対応のある Student の t 検定
を用い、有意水準は **5%** とした。
## 3. 結果
### 3-1. 男女間の握力差
* 男:47.8 ± 11.6 kg(n=62)
* 女:32.6 ± 7.3 kg(n=31)
* 検定結果:**p < 0.001(有意差あり)** 男の方が女より明らかに高い握力を示した。 --- ### 3-2. A・B クラス間比較 #### 男性 * Aクラス:48.9 ± 12.3 kg(n=30) * Bクラス:46.7 ± 10.8 kg(n=32) * **p > 0.05(有意差なし)**
#### 女性
* Aクラス:32.5 ± 7.8 kg(n=17)
* Bクラス:32.8 ± 7.0 kg(n=14)
* **p > 0.05(有意差なし)**
男女ともに、クラス間で有意な差は認められなかった。

### 3-3. 発声(シャウト)による握力の変化
#### 男性
* 発声なし:47.8 ± 11.6 kg
* 発声あり:49.7 ± 12.5 kg(n=62)
* **p < 0.001(p = 0.00013)有意差あり** 発声により握力が平均 **1.9 kg** 増加した。 #### 女性 * 発声なし:32.6 ± 7.3 kg * 発声あり:33.6 ± 7.6 kg(n=31) * **p > 0.05(p = 0.078)有意差なし**
女性では増加傾向はあるものの、有意差には至らなかった。

## 4. 考察
### 4-1. 男女間の握力差
男性の握力が女性より有意に高かったことは、一般的に報告されている性差と一致する。
筋量の差や、ホルモン(特にテストステロン)による筋力発達の違いが要因として考えられる。
### 4-2. クラス間の比較
男女ともに A・B クラス間に握力差はみられなかった。
対象学生は同年代かつ同様の生活環境であることから、クラスによる身体的特徴の偏りは大きくないと推測される。
### 4-3. 発声による握力増強効果
男性では発声により握力が有意に増加した。一方、女性では増加傾向はあるものの有意差はみられなかった。
発声(いわゆるシャウト効果)は、
* 瞬発的な筋出力を高める交感神経系の賦活
* 腹圧の上昇による体幹の安定
などが関与すると考えられる。
今回女性で有意差がなかった理由としては、
* 元々の筋力レベルが低く、発声による増加幅が小さい
* シャウトの強度に個人差が大きい
* 標本数が男性より少なく統計的パワーが不足した
などが挙げられる。

## 5. 結論
1. **男女間には有意な握力差があり、男性の方が高い握力を示した。**
2. **クラス間には男女とも握力の有意な差は認められなかった。**
3. **発声により男性では有意な握力増強効果がみられたが、女性では有意な変化は認められなかった。**
以上より、握力には明確な性差が存在し、また発声による筋力増強効果は性によって異なる可能性が示唆された。

###

*2:学とみ子の「STAP事件がこれだけ大事になり、10年以上経っても、 … その人自身が科学の勉強をしながら、事の推移を見守っていくのが良いのではないかと感じます。」をGPTZeroに入力するとWe are highly confident this text is entirely humanと判定されました。