RADD：マルチモーダル知識グラフ補完のための検索拡張離散拡散

arXiv cs.AI / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、多くのマルチモーダル知識グラフ補完（MMKGC）手法が単一の埋め込みスコアラで「大域的な検索」と「局所的な再ランキング」を同時に行っており、その結合が性能のボトルネックになっていると主張している。
RADD（Retrieval-Augmented Discrete Diffusion）では、検索と再ランキングを分離し、関係を考慮したマルチモーダルKGEリトリーバを大域検索と蒸留（distillation）の教師として用いる。
条件付きの離散デノイザがショートリスト内の候補となる「エンティティ同一性」を生成し、学習ではKGEの教師あり学習、デノイズの交差エントロピー、温度スケールした蒸留を組み合わせている。
推論ではまずリトリーバでトップKのショートリストを作ってリコールを厳密に確保し、その後デノイザで再ランキングして精度を高める「Diff-Rerank」を設計し、複数のベンチマークとアブレーションで効果を確認している。
実験の結果、RADDは3つのMMKGCベンチマークで、ユニモーダル／マルチモーダル／LLMベースの強力なベースラインに対して最良の性能と一貫した改善を示している。

note

note

note

note

note