要旨: 大規模言語モデル(LLM)は、多段階の推論トレースを生成することで複雑な問題を解きます。しかし、これらのトレースは通常、2つの観点のいずれか一方からのみ分析されます。すなわち、生成されたテキスト内の異なる推論ステップをまたいだトークン列、あるいは1ステップ内におけるモデル各層の隠れ状態ベクトルです。私たちは、両レベルを同時に分析するための枠組みおよび診断ツールであるPRISM(Probabilistic Reasoning Inspection through Semantic and Implicit Modeling)を導入します。これにより、推論がステップと層の双方にわたってどのように進化するかを統一的に捉えられます。複数の推論モデルおよびベンチマークにおいて、PRISMは推論プロセスにおける体系的なパターンを明らかにし、失敗した軌跡が生産的でない検証ループに閉じ込められやすく、さらに、過剰な考え込みや早すぎるコミットメントといった異なるモードへ分岐し、いずれも候補となる解答に到達した後には異なる振る舞いを示すことを示します。加えて、プロンプトが推論行動を、集計された精度を超えてどのように再形作るか、すなわちセマンティック遷移と内部の計算パターンの両方を変えることによって明らかにします。推論トレースを構造化されたプロセスとしてモデル化することで、PRISMはこれらの振る舞いを、最終タスクの精度のみに依存することなく、観測可能かつ分析可能にします。以上を総合すると、これらの知見は、LLMにおける推論プロセスを分析し診断するための実用的なツールとしてPRISMを位置づけます。
PRISM:セマンティック・フローと潜在計算によるLLM推論の二重視点
arXiv cs.CL / 2026/3/25
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- PRISMは、LLMの推論を2つのレベルで共同的に分析するフレームワークおよび診断ツールとして導入される。すなわち、セマンティックなトークン/ステップの軌跡と、層をまたいだ潜在的な内部計算である。
- 複数の推論モデルとベンチマークを用いて、本研究は、生産性のない検証ループに閉じ込められてしまうような、失敗した推論軌跡に見られる体系的なパターンを特定する。
- 分析により、異なる発散モードが明らかになる。たとえば、過剰な考え込みと時期尚早な確約(コミットメント)のようなものが、候補となる解答に到達した後にそれぞれ異なる形で現れる。
- PRISMは、プロンプトが最終的な精度だけでなく、セマンティック遷移の起こり方や、内部の計算パターンがどのように変化するかにも影響を与え得ることを示す。
- 推論を構造化されたプロセスとしてモデル化することで、PRISMは、中間段階の推論挙動を、最終課題の精度だけに頼るのではなく、観測可能かつ診断可能にすることを目指す。