MM-StanceDet:検索拡張型マルチモーダル・マルチエージェントによる態度(スタンス)検出
arXiv cs.AI / 2026/5/1
📰 ニュースModels & Research
要点
- 本論文は、対立する信号がある場合にテキストと画像をどのように確実に融合して態度(スタンス)を検出するかという、マルチモーダル・スタンス検出の難題に取り組みます。
- MM-StanceDetとして、文脈グラウンディングとクロスモーダル解釈を改善するための、検索拡張型マルチエージェントの枠組みを提案しています。
- 専門のマルチモーダル解析エージェントに加えて、複数の視点を検討してから判断する「推論強化ディベート」段階を組み合わせます。
- さらに、単一パス推論の脆さによる誤りに対抗するための「自己反省(セルフリフレクション)」で最終的な判定を頑健にしています。
- 5つのデータセットでの実験により、MM-StanceDetが既存の最先端ベースラインを大きく上回り、この構造化されたマルチエージェント設計の有効性が示されています。




