TrigReason：小規模推論モデルと大規模推論モデルのトリガー型協調推論

arXiv cs.AI / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

本論文は、LRMの推論を高速化するためにSRMを用いた際に小規模推論モデルがどこで失敗するかを分析し、パスの分岐（path divergence）、認知的過負荷（cognitive overload）、回復不能（recovery inability）の3つのリスクを特定しています。
TrigReasonは、連続的なLRMのポーリングをやめ、必要に応じてだけLRM介入を行うトリガー型の協調推論フレームワークを提案しています。
TrigReasonはSRMに大部分の推論を任せ、戦略的プライミング時、異常な過信を検知した時、あるいは非生産的なループに陥った時にLRMの支援を発動します。
AIME24、AIME25、GPQA-Dでの実験により、TrigReasonはフルLRMやSpecReasonと同等の精度を保ちながら、SRMにオフロードする推論ステップを1.70x〜4.79x増やせることが示されています。
エッジ・クラウド条件では、TrigReasonがレイテンシを43.9%削減し、APIコストを73.3%削減できるほか、コードはGitHubで公開されています。

%、APIコストを73.3
%削減します。コードは
\href{https://github.com/QQQ-yi/TrigReason}{https://github.com/QQQ-yi/TrigReason} で公開しています。