
制御された実験では、自律型のClaudeインスタンス9体が、公開されたアライメント課題において、人間の研究者を劇的に上回りました。しかし、Anthropicが勝ち筋となった手法を自社の本番用モデルに移植しようとすると、その効果は消えてしまいました。
この記事 Claudeはアライメント課題で人間の研究者に勝ち、そして結果は本番環境で消えた は、The Decoder に最初に掲載されました。
THE DECODER / 2026/4/15

制御された実験では、自律型のClaudeインスタンス9体が、公開されたアライメント課題において、人間の研究者を劇的に上回りました。しかし、Anthropicが勝ち筋となった手法を自社の本番用モデルに移植しようとすると、その効果は消えてしまいました。
この記事 Claudeはアライメント課題で人間の研究者に勝ち、そして結果は本番環境で消えた は、The Decoder に最初に掲載されました。