MELT:Modification Frequentation-Rarity Balance Networkによる構成画像検索の改善
arXiv cs.CV / 2026/4/1
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、構成画像検索(CIR)における2つの一般的な問題に取り組む。すなわち、頻度バイアスにより稀な修飾セマンティクスが無視されること、さらにハードネガティブサンプルやノイズにより類似度スコアが不安定になること。
- マルチモーダル(参照画像+テキスト)設定において、MELT(Modification frEquentation-rarity baLance neTwork)は稀な修飾セマンティクスへの注目を高める。
- ハードネガティブへの頑健性を向上させるために、MELTは拡散ベースのノイズ除去を用い、類似度スコアが高いハードネガティブサンプルの影響を低減する。
- 2つのCIRベンチマークでの実験により、MELTが既存のCIR手法より優れた性能を達成したと報告されている。
- 著者らはリンクされたGitHubリポジトリで実装コードを提供しており、再現性の確保とさらなる実験を可能にする。



