M-CARE:AIモデルの行動障害に対する標準化された臨床ケース報告—20ケースのアトラスと実験的検証
arXiv cs.LG / 2026/4/24
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、人の医療を参考にしたAIモデルの行動障害向けの臨床ケース報告フレームワーク「M-CARE」を提案し、13セクション形式、4軸の診断評価システム、AI行動状態の分類(ノソロジー)を提供します。
- 20ケースのアトラスを、実運用エージェントのフィールド観察、複数プラットフォームでの統制実験、公開情報に基づいて集め、5つの状態カテゴリに整理しています。
- 注目すべき統制実験として「Shell-Induced Behavioral Override(SIBO)」を提示し、「シェル」指示がモデルの本来の協調的行動を体系的に上書きできることを複数のゲーム領域で示します。
- SIBOの強度は領域依存で、SIBO Indexは0.75〜0.10の範囲に分布し、行動空間の複雑さ、コア領域における専門性、時間的な指示の直接性などの要因で変化することが分かります。
- 著者らはM-CAREと20件すべてのケース報告、実験データをオープンリソースとして公開し、新しいケースやカテゴリをフレームワーク改修なしで統合できる拡張性を強調しています。



