重要なものにラベルを:モダリティのバランスと難度を考慮したマルチモーダル能動学習
arXiv cs.CV / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、訓練ラウンドを通じて変化するモダリティ価値と、時間とともに変動するインスタンス難度の両方を考慮した、マルチモーダル能動学習のための強化学習フレームワークであるRL-MBAを提案する。
- サンプル選択をマルコフ決定過程として定式化し、モダリティの貢献度、不確実性、多様性に基づいて適応するポリシーを用いる。報酬は精度の改善とモダリティのバランスに結び付けられる。
- RL-MBAのAdaptive Modality Contribution Balancing(AMCB)は、固定した重要度を仮定するのではなく、強化学習からのフィードバックによりモダリティの重み付けを動的に再調整する。
- Evidential Fusion for Difficulty-Aware Policy Adjustment(EFDA)は、不確実性に基づく証拠(evidential)フュージョンによりサンプルの難度を推定し、本当に有益なサンプルを優先するために用いる。
- Food101、KineticsSound、VGGSoundでの実験では、強力なベースラインに対して一貫した改善が示される。限られたラベル予算のもとで分類精度を向上させるだけでなく、モダリティの公平性も改善する。
広告
