BALM: 不均衡な欠損率下でのバランスのとれたマルチモーダル学習のためのモデル非依存フレームワーク

arXiv cs.CV / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • BALM は、情報量が豊富なモダリティの優位性を解消し、IMR(不均衡な欠損率)の下でバランスの取れたマルチモーダル学習を実現する、モデル非依存のプラグイン型フレームワークです。
  • Feature Calibration Module (FCM): グローバルな文脈を用いて単一モーダル特徴を再キャリブレーションし、欠損パターン間で表現を整合させるモジュールです。
  • Gradient Rebalancing Module (GRM): 分布的および空間的観点から、モダリティ間の学習バランスを取るために勾配の大きさと方向を調整します。
  • BALM はバックボーン非依存で、構造を変えることなく、マルチモーダル感情認識(MER)モデルを含む多様なアーキテクチャに統合できます。
  • 複数の MER ベンチマークにおける実験結果は、BALM がさまざまな欠損・不均衡設定下でロバスト性と性能を向上させることを示しており、コードは提供された GitHub リポジトリで公開されています。

要約:複数のモダリティから学習することは、情報量が豊富なモダリティが最適化を支配し、弱いモダリティや部分的に欠損しているモダリティの寄与が少なくなるという不均衡にしばしば悩まされます。この不均衡は、欠損率が不均衡な現実的な設定、すなわち各モダリティが異なる確率で欠落するIMR(Imbalanced Missing Rate)の下で深刻化し、表現学習と勾配ダイナミクスを歪めます。我々はこの問題をトレーニング過程の観点から再検討し、IMR下でバランスの取れた多モーダル学習を実現するモデルアグノスティックなプラグインフレームワーク BALM を提案します。フレームワークは、二つの補完的なモジュールから構成されます:特徴キャリブレーションモジュール(FCM)は、グローバルコンテキストを用いて単一モダリティの特徴を再キャリブレーションし、異種の欠損パターンにまたがる共有表現基盤を確立します;勾配リバランシングモジュール(GRM)は、分布的視点と空間的視点の両方から勾配の大きさと方向を調整することにより、モダリティ間の学習ダイナミクスを均衡させます。 BALM は、アーキテクチャを変更することなく、マルチモーダル感情認識(MER)モデルを含む多様なバックボーンへシームレスに組み込むことができます。複数のMERベンチマークにおける実験結果は、 BALM が一貫して頑健性を高め、さまざまな欠損と不均衡の設定下でパフォーマンスを向上させることを確認しています。コードは以下のリンクで入手可能です: https://github.com/np4s/BALM_CVPR2026.git