HyCal:異分野のFew-Shotクラスインクリメンタル学習のためのトレーニング不要プロトタイプ校正手法

arXiv cs.CV / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、データが異なる専門分野から生まれ、サンプル数が偏り、視覚的な複雑さも異なる現実的な状況では、既存のfew-shotクラスインクリメンタル学習(FSCIL)手法がうまく機能しないと主張しています。
  • 「Domain Gravity(ドメイン重力)」として、過剰に存在する(またはエントロピーが低い)ドメインが埋め込み空間を支配し、プロトタイプのドリフトや、過小なドメイン(高エントロピー)での性能低下を招く表現上の非対称性を提示しています。
  • それに対処するため、異分野の不均一性と不均衡を反映し、Domain Gravityを自然に強めるXD-VSCILというベンチマークを提案しています。
  • また、凍結したCLIP埋め込み上で、トレーニング不要のHyCal(Hybrid Prototype Calibration)として、コサイン類似度とマハラノビス距離を組み合わせることで、方向の整合と共分散を考慮した大きさの両面からプロトタイプを安定化させます。
  • 実験では、HyCalがDomain Gravityを軽減し、既存のFSCIL手法より優れることが示され、保持と適応の両面で改善しつつ効率も保たれると報告されています。

Abstract

CLIPのような事前学習済みの視覚-言語モデル(VLM)は継続学習において有望ですが、既存のFew-Shot Class-Incremental Learning(FSCIL)手法は同質なドメインとバランスの取れたデータ分布を前提としているため、データが不均衡なサンプル利用可能性や多様な視覚的複雑性を伴って異種の分野から生じる現実世界での適用可能性が制限されています。私たちは、Domain Gravity(ドメイン重力)を特定します。これは、異種ドメイン間でのデータ不均衡により、過剰表現された、あるいは低エントロピーのドメインが埋め込み空間に対して不釣り合いに影響し、その結果、プロトタイプのドリフトが生じ、過小表現された、あるいは高エントロピーのドメインで性能が劣化するという、表現の非対称性です。これに対処するために、現実世界の異質性と不均衡を捉え、Domain Gravityが自然に増幅される状況を含むベンチマークであるCross-Discipline Variable Few-Shot Class-Incremental Learning(XD-VSCIL)を提案します。さらに、訓練不要の手法であるHybrid Prototype Calibration(HyCal)を導入します。これは、コサイン類似度とマハラノビス距離を組み合わせて補完的な幾何学的性質、すなわち方向的整合(directional alignment)と共分散を考慮した大きさ(covariance-aware magnitude)を捉え、異種で不均衡な条件下でも安定したプロトタイプをもたらします。凍結したCLIP埋め込みに基づいて動作するHyCalは、効率を維持しながら、継続保持-適応の改善を一貫して達成します。実験の結果、HyCalはDomain Gravityを効果的に緩和し、不均衡なクロスドメインの逐次学習において既存手法を上回ることが示されます。