%、APIコストを73.3
%削減します。コードは
\href{https://github.com/QQQ-yi/TrigReason}{https://github.com/QQQ-yi/TrigReason} で公開しています。
TrigReason:小規模推論モデルと大規模推論モデルのトリガー型協調推論
arXiv cs.AI / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本論文は、LRMの推論を高速化するためにSRMを用いた際に小規模推論モデルがどこで失敗するかを分析し、パスの分岐(path divergence)、認知的過負荷(cognitive overload)、回復不能(recovery inability)の3つのリスクを特定しています。
- TrigReasonは、連続的なLRMのポーリングをやめ、必要に応じてだけLRM介入を行うトリガー型の協調推論フレームワークを提案しています。
- TrigReasonはSRMに大部分の推論を任せ、戦略的プライミング時、異常な過信を検知した時、あるいは非生産的なループに陥った時にLRMの支援を発動します。
- AIME24、AIME25、GPQA-Dでの実験により、TrigReasonはフルLRMやSpecReasonと同等の精度を保ちながら、SRMにオフロードする推論ステップを1.70x〜4.79x増やせることが示されています。
- エッジ・クラウド条件では、TrigReasonがレイテンシを43.9%削減し、APIコストを73.3%削減できるほか、コードはGitHubで公開されています。




