Claude Mythos Preview System Card - 2. RSP評価(1)
Zenn / 2026/4/11
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- Claude Mythosのプレビュー用「System Card」について、RSP評価のうち第1部(2. RSP評価(1))の内容を扱っている記事です。
- 具体的にRSP評価をどう捉え、どのような観点で評価するのかを整理することに主眼があります。
- 評価設計の考え方(評価項目・前提・見方)を示し、モデルの挙動を検証するためのフレームに近い役割を担います。
- 学習/実装側だけでなく、リリースや品質保証の意思決定にも関わる評価プロセスの理解を促します。
!
本記事は,Anthropicが公開した Claude Mythos Preview System Card の日本語訳です.
2 RSP評価
2.1 RSPリスク評価プロセス[1]
Our Responsible Scaling Policy (RSP) is our voluntary framework for managing catastrophic risks from advanced AI systems. ^{3} It establishes how we identify and evaluate risks, how we make decisio...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →


