RADD:マルチモーダル知識グラフ補完のための検索拡張離散拡散
arXiv cs.AI / 2026/4/29
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、多くのマルチモーダル知識グラフ補完(MMKGC)手法が単一の埋め込みスコアラで「大域的な検索」と「局所的な再ランキング」を同時に行っており、その結合が性能のボトルネックになっていると主張している。
- RADD(Retrieval-Augmented Discrete Diffusion)では、検索と再ランキングを分離し、関係を考慮したマルチモーダルKGEリトリーバを大域検索と蒸留(distillation)の教師として用いる。
- 条件付きの離散デノイザがショートリスト内の候補となる「エンティティ同一性」を生成し、学習ではKGEの教師あり学習、デノイズの交差エントロピー、温度スケールした蒸留を組み合わせている。
- 推論ではまずリトリーバでトップKのショートリストを作ってリコールを厳密に確保し、その後デノイザで再ランキングして精度を高める「Diff-Rerank」を設計し、複数のベンチマークとアブレーションで効果を確認している。
- 実験の結果、RADDは3つのMMKGCベンチマークで、ユニモーダル/マルチモーダル/LLMベースの強力なベースラインに対して最良の性能と一貫した改善を示している。




