Air-Know：専門家で較正した知識内在化ロバストネットワークによる合成画像検索

arXiv cs.CV / 2026/4/22

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

この論文は、合成画像検索（CIR）が Noisy Triplet Correspondence（NTC）問題によって大きく制約されていると指摘し、NTC特有の「部分一致」などの意味的曖昧さが、従来のロバスト学習で使われる「小さな損失仮説」を崩すことを示しています。
著者らは、学習者とアービタ（審判役）が絡み合うことで表現が壊れてしまう「表現汚染」を起こし得る悪循環を避けるための新手法として、Air-Know（ArbIteR calibrated Knowledge iNternalizing rObust netWork）を提案します。
Air-Know は「Expert-Proxy-Diversion（専門家−代理−転換）」の分離パラダイムに基づき、(1) 外部事前アービトレーション（EPA）でマルチモーダルLLMをオフライン専門家として用い高精度なアンカーデータセットを作成し、(2) 専門知識内在化（EKI）で軽量な代理アービタが専門家の識別ロジックを内在化できるよう導き、(3) 双方向ストリーム調停（DSR）でマッチング信頼度に応じて学習データを分岐させます。
複数のCIRベンチマークで実験を行った結果、Air-Know は NTC のノイズ設定において既存の最先端手法を大幅に上回り、通常の（非NTC）CIRでも高い競争力を示しました。
本研究は、オフラインの専門家知識で学習を較正し、信頼度に基づくデータ分岐によって「審判」と「表現学習」を切り分えるという、ロバスト学習の実用的な方針を示しています。