概要: 生成AIが進展するにつれて、真正なメディアと合成メディアの区別がますます曖昧になり、オンライン情報の完全性が脅かされています。本研究では、誤ったキャプション付与(miscaptioned)、編集(edited)、およびAI生成(AI-generated)された視覚コンテンツを含む、多モーダルな誤情報からなる大規模データセットCONVEXを提示します。これは、XのCommunity Notesに由来する関連注釈とエンゲージメント指標を伴う、150K件超の多モーダル投稿で構成されています。合成メディアに焦点を当てつつ、多モーダルな誤情報がバイラリティ(拡散性)、エンゲージメント、そしてコンセンサス(合意)のダイナミクスの観点でどのように進化するかを分析します。その結果、AI生成コンテンツは不釣り合いなほど高いバイラリティを達成する一方で、その拡散は能動的な議論ではなく主に受動的なエンゲージメントによって駆動されていることが分かりました。初期の報告は遅いにもかかわらず、フラグ付けされるとAI生成コンテンツはより速くコミュニティの合意に到達します。さらに、専門化された検出器および視覚言語モデルの評価から、生成モデルが進化するにつれて、合成画像と真正画像を見分ける性能が時間とともに一貫して低下することが示されました。これらの知見は、急速に進化するデジタル情報環境において、継続的な監視と適応的な戦略の必要性を強調しています。
シンセティック・メディアの転換:生成AIによるマルチモーダル偽情報の台頭、拡散の拡大、検知可能性の追跡
arXiv cs.AI / 2026/4/20
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文は、XのCommunity Notesを通じて収集したマルチモーダル偽情報の大規模データセット「CONVEX」(15万件超)を提示し、誤キャプション、改変、AI生成画像を含めます。
- AI生成コンテンツは相対的に大きなバイラリティを得やすい一方で、その拡散は主に能動的な議論ではなく受動的なエンゲージメントによって駆動されることを示します。
- 初動での通報は遅いものの、フラグ付け後はコミュニティとしての合意形成がより早まることが観察されます。
- 専用検知器や視覚-言語モデルによる評価では、生成モデルの進化に伴い「合成か真正か」を見分ける性能が時間とともに一貫して低下することが分かります。