分解された重み融合による動的環境におけるロバストな身体化知覚

arXiv cs.CV / 2026/4/3

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、動的で分布が変動する物理環境に適応しなければならない身体化知覚システム向けに、例示なしかつドメインIDなしの漸増学習フレームワークを提案する。
  • 環境のスタイルに起因する本質ではない干渉を抑制するための分解表現メカニズムを導入し、シーン間で共有される意味的特徴にモデルが焦点を当てられるようにする。
  • 過去データを保存せずに継続的な適応を改善するために、重み空間上で旧環境と新環境の知識を組み合わせる重み融合戦略を用い、壊滅的忘却を抑える。
  • 複数のベンチマークデータセットでの実験により、完全にドメインIDなしかつ例示なしの設定下で、既存の最先端手法と比べて壊滅的忘却が大幅に低減され、精度も向上することが報告される。

Abstract

身体性を備えた知覚システムは、開放的な物理空間で継続的に相互作用する際に、動的な環境分布のドリフトという深刻な課題に直面します。しかし、既存のドメイン増分認識(incremental awareness)手法の多くは、テスト時に事前に取得したドメインIDに依存していることが多く、未知の相互作用シナリオにおける実用性を制限しています。同時に、モデルはしばしば文脈固有の知覚ノイズに過適合してしまい、その結果、汎化能力が不十分になり、致命的忘却(catastrophic forgetting)が生じます。これらの制約に対処するため、身体性を備えたマルチメディアシステム向けに、ドメインIDおよびエクセンプラ(exemplar)不要の増分学習フレームワークを提案します。これは、頑健な継続的環境適応を達成することを目的としています。本手法では、環境スタイルに起因する本質でない干渉を除去するための非連関化表現(disentangled representation)メカニズムを設計し、シーン間で共有される意味的な内在特徴の抽出にモデルを導くことで、知覚的不確実性を解消し、汎化を改善します。さらに、重み融合(weight fusion)戦略を用いて、パラメータ空間において旧環境と新環境の知識を動的に統合し、過去のデータを保存することなく新しい分布へ適応でき、かつ旧環境の識別能力を最大限保持できるようにします。複数の標準ベンチマークデータセットに対する大規模な実験により、本手法は、完全にエクセンプラ不要かつドメインID不要の設定において、致命的忘却を大幅に低減することが示されています。また、精度は既存の最先端手法よりも優れています。