Air-Know:専門家で較正した知識内在化ロバストネットワークによる合成画像検索
arXiv cs.CV / 2026/4/22
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文は、合成画像検索(CIR)が Noisy Triplet Correspondence(NTC)問題によって大きく制約されていると指摘し、NTC特有の「部分一致」などの意味的曖昧さが、従来のロバスト学習で使われる「小さな損失仮説」を崩すことを示しています。
- 著者らは、学習者とアービタ(審判役)が絡み合うことで表現が壊れてしまう「表現汚染」を起こし得る悪循環を避けるための新手法として、Air-Know(ArbIteR calibrated Knowledge iNternalizing rObust netWork)を提案します。
- Air-Know は「Expert-Proxy-Diversion(専門家−代理−転換)」の分離パラダイムに基づき、(1) 外部事前アービトレーション(EPA)でマルチモーダルLLMをオフライン専門家として用い高精度なアンカーデータセットを作成し、(2) 専門知識内在化(EKI)で軽量な代理アービタが専門家の識別ロジックを内在化できるよう導き、(3) 双方向ストリーム調停(DSR)でマッチング信頼度に応じて学習データを分岐させます。
- 複数のCIRベンチマークで実験を行った結果、Air-Know は NTC のノイズ設定において既存の最先端手法を大幅に上回り、通常の(非NTC)CIRでも高い競争力を示しました。
- 本研究は、オフラインの専門家知識で学習を較正し、信頼度に基づくデータ分岐によって「審判」と「表現学習」を切り分えるという、ロバスト学習の実用的な方針を示しています。



