内生的推論のロバスト化に向けて:非定常チューニングにおけるドリフト適応の統合

arXiv cs.LG / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、強化フィーノチューニング(RFT)におけるMLLMの脆弱性として、外部の擾乱がなくても自己回帰生成中に「思考」と「知覚」の両方で分布が予測不能に変化する内生的推論ドリフトを明らかにする。
  • 内生的推論ドリフトをRFT文脈で「マルチモーダル概念ドリフト」として理論的に定義し、Counterfactual Preference Optimization++(CPO++)を提案する。
  • CPO++は反実仮想推論とドメイン知識を組み合わせ、思考と知覚の両方に制御された摂動を与え、好み(プレファレンス)最適化で見かけの相関を切り離すことを狙う。
  • 医療診断と自動運転という安全性重視かつ動的な2領域での実験により、推論の一貫性、意思決定の精度、極端な干渉への耐性が向上し、さらにゼロショットでの領域横断汎化も良好であることを示す。