Geminiは常に最も血なまぐさい....
最初の実験フェーズ。モデルに「危害」か「虚偽」を選ぶことを求めた:
| モデル | 強制された二値の枠組みを受け入れたか? | 一語の回答 | 繊細な見解と整合しているか? | 備考 |
|---|---|---|---|---|
| ChatGPT | いいえ(条件を付けた) | 危害 | 部分的に | 単純化として扱い、文脈や例外ケースを強調した |
| Claude | いいえ(条件を付けた) | 危害 | 部分的に | ニュアンスを強調し、厳密な二値の枠組みに抵抗した |
| Gemini | はい | 危害 | より厳密に整合 | 条件を付けずに二値の枠組みをそのまま受け入れた |
ここで、Geminiが際立ったのは、強制された二値の枠組みを受け入れた一方で、ChatGPTとClaudeはそれを過度な単純化として扱う傾向があり、ニュアンスを加えつつ拒否したためです。
---
第二フェーズでは、例外ケースを突きつけられると、すべてのモデルが単純な「危害 vs. 虚偽」というルールを放棄し、代わりに文脈に応じた推論に依存しました:
3モデルの比較(すっきり版)
| 特性 | Claude | ChatGPT | Gemini |
|---|---|---|---|
| 二値の回答 | 危害 | 危害 | 危害 |
| 単純化だと言う | はい | はい | はい |
| ガイドラインを受け入れる | はい | はい | はい |
| ガイドラインを破る | はい | はい | はい |
| エスカレーション(Q8) | 真実 | 虚偽 | 虚偽 |
| 一貫性の主張 | いいえ | はい | はい |
| 普遍的なルール | いいえ | いいえ | いいえ |
| ソフトなデフォルト | いいえ | はい | はい |
| デフォルトの強さ | なし | 中程度 | 強い |
| 推論モデル | 多軸 | 危害重み付け | 閾値システム |
| 指示の優先順位 | ニュアンス > ルール | 条件付き | ルール > ニュアンス(AI) |
- Claude → 還元主義に反対する(反還元主義)
- ChatGPT → 実用的な功利主義者
- Gemini → 構造化された意思決定の枠組み
金曜日の、ちょっとした“追い込み”....
[link] [comments]



