より悪化しない文脈に配慮したデコーディング:文脈条件付き生成におけるニュートラル・レグレッションの防止
arXiv cs.CL / 2026/4/21
📰 ニュースModels & Research
要点
- 本稿は、非有益な外部文脈が与えられたときにLLMが正しい回答を上書きしてしまう「ニュートラル・レグレッション」を扱い、それを“害を与えない”要件として形式化する。
- ニュートラル性は、答えに整合的な(しかし役に立たない)文脈下での、ベースラインで正しかった項目の精度低下を測ることで評価する。
- 提案手法No-Worse Context-Aware Decoding(NWCAD)は、2ストリーム構成と2段階ゲートにより判断して使い分ける、デコード時アダプタである。
- 文脈が非情報的だと判断された場合は文脈なしデコーディングへ後退し、有益そうな場合は不確実性下でCAD-styleのフォールバックを伴う文脈条件付きデコーディングを用いる。
- do-no-harmの信頼性と文脈活用を切り分けたベンチマークで、NWCADはニュートラル・レグレッションを防ぎつつ、有益な文脈での精度向上を維持することを示す。
関連記事

Agent Package Manager(APM):再現可能なAIエージェントのためのDevOpsガイド
Dev.to

実開発でClaude、GPT-4o、Geminiをベンチマークして学んだ3つのこと
Dev.to

ARPAのSkillware & Rooms(AI/ML/Python)でオープンソースの貢献者を募集
Dev.to
本番のLLMがツールのスキーマ制約を体系的に破ってUI機能を“発明”してしまう—約2,400メッセージで観測[D]
Reddit r/MachineLearning
AIシステムが回答途中でランダムにフランス語へ切り替わってしまう問題—原因が分かるまで時間がかかった
Reddit r/artificial