MILD：双方向知覚と多層アラインメントによる人車協調のためのメディエータエージェントシステム

arXiv cs.AI / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、部分的な運転自動化が人間の運転負荷を高め得る理由として、車両側の意図や意思決定ロジックに関する透明性の不足、さらに車両が運転者の動的状態や嗜好を十分に把握できないことによる双方向のミスマッチを指摘しています。
そこで、受動的な監督から能動的なマネジメントへ人間の役割を引き上げるパラダイム転換を提案し、人車協調のためのエージェントシステム「Mediator-in-the-Loop-Driving（MILD）」を導入します。
MILDは、車内と車外の双方の理解を行う知覚エージェントと、安全で説明可能な行動提案を生成する軽量な戦略エージェントを統合します。
安全規制と人間の価値観との整合性を厳密に担保するために、Evidence- and Constraint-weighted Policy Optimization（ECPO）を開発し、自動バリデータで“正確なだけでなく構造的に完全で、根拠があり、制約違反のない”振る舞いへエージェントを誘導します。
さらに、検索拡張生成により交通規則、速度推奨、運転者の嗜好といった制約を意思決定ループへ動的に取り込みます。3つの公開データセットでのフィールド実験では、監査可能なオフライン指標においてベースラインを一貫して上回り、また人による評価でも政策の妥当性・快適性・説明性が高いことが示されています。

要旨: 先行研究では、部分的な運転自動化が人間のドライバーにかかる認知的負荷を増大させ得ると報告されている。この効果の主因は、人間のドライバーが車両の意図や意思決定ロジックを十分に透明に把握できないこと、ならびに自動化システムがドライバーの動的な状態や嗜好に対して限定的な認識しか持てないことにある。この双方向の不一致は、共有された状況認識を損ない、人間と車両のインタラクションにおける協調の失敗をさらに悪化させる。これらの制約に対処するために、受動的な監督者から能動的な管理者へと人間の役割を引き上げるパラダイムシフトを提案する。私たちは、人間と車両の協調を相乗的に促進するためのエージェント型システムアーキテクチャに基づくMediator-in-the-Loop-Driving（MILD）システムを導入する。MILDは、車内および車外の共同理解のための知覚エージェントと、準拠的で説明可能な行動提案を生成する軽量な戦略エージェントを統合する。これらの戦略を安全規制および人間の価値観と厳密に整合させるために、Evidence- and Constraint-weighted Policy Optimization（ECPO）を開発する。ECPOは自動バリデータを活用し、単に正確であるだけでなく、構造的に完全であり、証拠によって裏付けられており、制約違反がない振る舞いへエージェントを誘導する。さらに、検索拡張型生成（retrieval-augmented generation）モジュールが、交通規則、速度の推奨、およびドライバーの嗜好からの制約を意思決定ループへ動的に取り込む。3つの公開データセットにまたがるフィールド実験により、MILDは、監査可能なオフライン指標において、知覚の精度と戦略の質の両方で一貫してベースラインを上回り、また、ベースラインよりも人間評価による方策の妥当性、快適性、説明の質が高いことが示された。本研究は、人間と車両の協調運転のための、監査可能で整合したエージェントを構築するための実践的な道筋を提供する。