概要: ミームの急速な拡散により、有害コンテンツの検出がますます重要になっています。効果的な識別ができれば、誤情報の流通を抑えることができます。しかし、既存の手法は高ボリュームの注釈付きデータに大きく依存しているため、学習コストが大きくなり、汎化性能が限定的です。これらの課題に対処するために、本論文ではPrismAgentというゼロショット・マルチエージェント・解釈可能な枠組みを提案します。PrismAgentは、このタスクを刑事事件の捜査として捉え、構造化された協調的ワークフローの中で、分析・捜査・起訴・判決の段階を担う4つの専門エージェントを用います。最初の段階では、アナリストエージェントが、善意および悪意の仮定のもとで各ミームを言い換え、それにより根底にある意図を探ります。次に、捜査官エージェントが、注釈なしデータセットから裏付けとなる証拠を取得し、ミームとそのバリエーションに対する文脈に基づく解釈を構築します。その後、検察官エージェントは、元のミームを3つの解釈それぞれと組み合わせることで、独立した3つの予備的判断を行います。最後に、裁判官エージェントが、すべての証拠にわたって検討し、最終的な判決を下します。さらに、PrismAgentの明示的なマルチステージの推論チェーンは、モデルを本質的に解釈可能にします。最終的な検出結果を出すだけでなく、すべての中間ステップが明示的に説明されるからです。3つの公開データセットに関する大規模な実験により、PrismAgentが既存のゼロショット検出手法を大きく上回ることが示されます。
PrismAgent:ゼロショットの解釈可能マルチエージェント枠組みでミーム中の有害性を可視化する
arXiv cs.LG / 2026/5/6
📰 ニュースModels & Research
要点
- 本論文は、ミームに含まれる有害コンテンツを検出するためのゼロショット型・解釈可能マルチエージェント枠組み「PrismAgent」を提案し、誤情報の拡散抑制に寄与することを目的としています。
- PrismAgentは、分析・証拠調査・検察・最終判断の4つの専門エージェントを用いた「犯罪捜査」のような一連の手順として、ミームの分析タスクを構成します。
- アナリスト段階では、善意と悪意の前提で各ミームを言い換え、意図の裏にある意味を探る仕組みを採用し、その後、注釈なしデータから根拠を取得して文脈に基づく解釈を構築します。
- 検察エージェントは、元のミームと各解釈を組み合わせて複数の予備判断を行い、裁定エージェントが全ての証拠を集約して最終結論を出します。
- 3つの公開データセットでの実験により、PrismAgentは既存のゼロショット型有害コンテンツ検出手法より大幅に高い性能を示し、特に中間推論を明示する多段推論の枠組みが効果に寄与しています。



