静的解析から視聴者への拡散へ:トレーニング不要のマルチモーダル・コントロバーシー検出マルチエージェント・フレームワーク
arXiv cs.LG / 2026/5/6
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文では、マルチモーダル・コントロバーシー検出(MCD)を静的な特徴抽出ではなく「視聴者への拡散」という動的プロセスとして捉える、トレーニング不要のマルチエージェント枠組みAuDisAgentを提案しています。
- その枠組みは、(動画・コメント・相互作用の)3つの専門スクリーニングエージェントで初期評価を行い、意見が一致しない場合にViewing Panelエージェントが多様な背景を持つ視聴者間の議論を模擬し、最終判断はArbitrationエージェントが下す仕組みです。
- 視聴者ごとの解釈や反応によって拡散過程で顕在化しうる「潜在的な論争」を捉えることを狙い、動画とコメントを単一の表現として扱う従来手法を超える改善を目指します。
- コメントがほとんどない新規動画(コールドスタート)への対応として、意味的に類似した過去動画の公開コメントを参照して初期コメント文脈を作るComment Bootstrapping Strategyを設計しています。
- 公開データセットでの実験により、AuDisAgentはコメントが豊富なケース/限られたケースの両方で既存の最先端手法(SOTA)を大きく上回ることが示されています。



