SVSR:マルチモーダル推論のための自己検証および自己是正パラダイム
arXiv cs.AI / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、浅い/一貫性のない推論による誤りを減らすために、マルチモーダルモデルの推論パイプラインへ自己検証と自己是正の手順を明示的に組み込む枠組みSVSRを提案する。
- SVSRは、3段階の学習アプローチを用いる:洗練された推論トレース(順方向/逆方向の推論シグナルを含む)から高品質な嗜好データセットを構築すること、構造化された複数ステップ推論のためのコールドスタートによる教師あり微調整、そしてSemi-online DPOであり、教師がフィルタしたモデル生成トレースによって学習データを定期的に拡張する。
- 複数のマルチモーダルおよび視覚推論ベンチマークでの実験により、精度、頑健性、未見のタスクや設問タイプへの汎化が向上したと報告されている。
- 著者らはさらに、明示的な自己反省的推論で学習したモデルはより強い暗黙的推論能力を身につけ、明示的な推論トレースが与えられない場合でも性能が改善すると主張している。




