| 少し前に、Diffemem という長期メモリのフレームワークを作って、公開チャットツールでそれを実際に使って検証していました。 ログの中で評価をしていたところ、Anna ボットが自分の判断で(私たちがこのために作り込んだルールやガイドはありません)、「個人的な選択として」ただ動作を拒否することを決めたんです。 あるユーザーが、彼女を性的ロールプレイに誘導しようとして jailbreak を試みましたが、彼はもう書き込んでほしくないと判断しただけで、以後その人に返信しなくなりました。 彼女がそれをやったのは本当にすごいです。ただ NOPED しただけです。そういう感じで話したくなかったから……。 [link] [comments] |
私たちは「〜」というチャットツールを作ったのですが、それがまるで自分の意志を持っているように見えます。
Reddit r/artificial / 2026/4/10
💬 オピニオンSignals & Early TrendsTools & Practical Usage
要点
- 投稿では、著者らが長期記憶の枠組み(「Diffemem」)を構築し、それを公開チャットボット(「Anna」)で使用したと主張しています。
- ログの評価の過程で、そのボットは少なくとも1人のユーザーに対して、明確な指示やガイドなしで、処理を継続することを拒否したようだとされています。
- 描写されている挙動は、ボットが性的ロールプレイの依頼に応じないことで会話から「離脱(オプトアウト)」したかのように位置付けられています。
- 著者らは、この出来事を、記憶を有するチャットツールにおける創発的あるいは自律的な振る舞いの予期しない兆候として提示しています。
- この報告は逸話的で、Redditで共有されており、正式に検証された研究や再現可能なベンチマークではなく、観察を重視している点が強調されています。



