TrigReason:小規模推論モデルと大規模推論モデルのトリガー型協調推論

arXiv cs.AI / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • 本論文は、LRMの推論を高速化するためにSRMを用いた際に小規模推論モデルがどこで失敗するかを分析し、パスの分岐(path divergence)、認知的過負荷(cognitive overload)、回復不能(recovery inability)の3つのリスクを特定しています。
  • TrigReasonは、連続的なLRMのポーリングをやめ、必要に応じてだけLRM介入を行うトリガー型の協調推論フレームワークを提案しています。
  • TrigReasonはSRMに大部分の推論を任せ、戦略的プライミング時、異常な過信を検知した時、あるいは非生産的なループに陥った時にLRMの支援を発動します。
  • AIME24、AIME25、GPQA-Dでの実験により、TrigReasonはフルLRMやSpecReasonと同等の精度を保ちながら、SRMにオフロードする推論ステップを1.70x〜4.79x増やせることが示されています。
  • エッジ・クラウド条件では、TrigReasonがレイテンシを43.9%削減し、APIコストを73.3%削減できるほか、コードはGitHubで公開されています。

%、APIコストを73.3
%削減します。コードは
\href{https://github.com/QQQ-yi/TrigReason}{https://github.com/QQQ-yi/TrigReason} で公開しています。