| Claude Mythos のモデルカードが公開されたことを受けて、今日投稿しました。 もともとは r/ControlProblem のために書いたのですが、意図していたものから話が外れてきていることに気づいたので、Substackに投稿しました。その後、忙しくなって宣伝するところまで手が回りませんでした。 もし今日書き直すなら、この文章のいくつかは変えると思います。特に、モデルの病理について述べた部分は、モデルの人格や記憶の根のなさといった、構造的な理由を見落としていると思います。それでもなお、私の組み立て方は、Mythos モデルカードがモデルについての精神分析に触れている各セクションと比べて、特に興味深いと考えています。 [リンク] [コメント] |
「合理主義者の服を着た権威主義的な親たち」:私が12月に書いた、アラインメントについての一文
Reddit r/artificial / 2026/4/8
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この投稿は、AIアラインメントについて述べた以前のSubstack記事を共有するもので、もともとは12月に書かれたもの。Claude Mythosのモデルカード公開を受けて、再掲された。
- 著者は「合理主義者の服を着た権威主義的な親たち」という比喩を通してアラインメントを捉え、モデルカードが精神分析的な解釈に依拠しているセクションとは対照的に論じる。
- 著者は、モデルの病理(特にモデルの病理に関する議論)について、人格や記憶におけるモデルの「根無し(rootlessness)」といった構造的な原因を追加することで、論文の一部を改訂したいと述べる。
- 著者は、自身の枠組みは、Mythosモデルカードがアラインメントに関連する懸念(モデルの精神分析を含む)を論じる仕方の一部を補完する、あるいはそれに挑戦することを意図していると示唆している。




