要約:単一ドメイン一般化は物体検出にとって不可欠であり、特に単一のソースドメインでモデルを訓練し、未見のターゲットドメインで評価する場合に重要です。天候、照明、またはシーン条件の変化といったドメインシフトは、既存のモデルの一般化能力に重大な課題をもたらします。これに対処するため、クロスドメイン特徴知識蒸留(CD-FKD)は、グローバルとインスタンス単位の特徴蒸留の両方を活用することで、学生ネットワークの一般化能力を高めます。
提案手法は、学生ネットワークを訓練するために、ダウンサンプリングと破損を通じた多様なデータを使用します。一方、教師ネットワークは元のソースドメインデータを受け取ります。
学生ネットワークは、グローバルおよびインスタンス単位の蒸留の両方を通じて教師の特徴を模倣し、破損の影響で検出が難しいオブジェクトであっても、オブジェクト中心の特徴を効果的に抽出できるようにします。
難易度の高いシーンにおける広範な実験は、CD-FKDがターゲットドメインの一般化とソースドメインの性能の双方において最先端の手法を上回ることを示しており、ドメインシフトに対する物体検出の頑健性を向上させるその有効性を検証しています。
このアプローチは、自動運転や監視など、さまざまな環境での堅牢な物体検出が重要になる現実世界の応用において価値があります。
CD-FKD: オブジェクト検出における堅牢な単一ドメイン一般化のためのクロスドメイン特徴知識蒸留
arXiv cs.CV / 2026/3/18
📰 ニュースModels & Research
要点
- 本論文はCD-FKDを提案する。これは、グローバル特徴蒸留とインスタンス単位の特徴知識蒸留を活用することで、オブジェクト検出の単一ドメイン一般化を改善するクロスドメイン特徴知識蒸留フレームワークである。
- 学習戦略は、教師が元のソースドメインデータ上で学習を指導する一方で、学生にはデータの多様化(縮小とノイズ付加/破損)を用いる。
- 学生は教師の特徴を模倣することで、オブジェクト中心の表現を抽出し、ドメインシフトが激しい状況、特に破損したシナリオを含む場合の検出性能を向上させる。
- 実験結果は、CD-FKDがターゲットドメイン一般化とソースドメイン性能の両方で最先端手法を上回ることを示し、自動運転や監視などの実世界アプリケーションへの影響を示唆する。
関連記事

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す
THE DECODER
Kreuzberg v4.5.0: Doclingのモデルをとても気に入ったので、より高速なエンジンを搭載しました
Reddit r/LocalLLaMA
今日は、qwen 120B のような比較的大きめのローカルモデルを動かすには、どんなハードウェアを用意すべきか?
Reddit r/LocalLLaMA
会議ノート作成のためにMistralをローカルで実行することは、私の用途には正直十分だ
Reddit r/LocalLLaMA
[D] 5つの年代にわたる単一アーティストの長期的ファインアートデータセットがHugging Faceに公開 — スタイルの進化、人物表現、倫理的トレーニングデータの潜在的応用
Reddit r/MachineLearning