DSO(Direct Steering Optimization):バイアス緩和のための直接ステアリング最適化

Apple Machine Learning Journal / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、入力中の人物の推定される属性に影響されてバイアスのある判断が生じ得る生成型の視覚言語モデルに対し、DSO(Direct Steering Optimization)を提案しています。
  • 公平性のための介入が性能低下を招くといった典型的なトレードオフに着目し、全体の性能を過度に犠牲にせずにバイアスを低減できることを目指しています。
  • DSOは、フェアネスとモデル能力のバランスに関する多様なユーザー要望に応える「制御可能なバイアス低減」を支援する設計です。
  • 本研究はCVPR 2026の論文として位置付けられており、AppleのGitHubリポジトリ(github.com/apple/ml-dso)でソースコードを公開しています。
Generative models are often deployed to make decisions on behalf of users, such as vision-language models (VLMs) identifying which person in a room is a doctor to help visually impaired individuals. Yet, VLM decisions are influenced by the perceived demographic attributes of people in the input, which can lead to biased outcomes like failing to identify women as doctors. Moreover, when reducing bias leads to performance loss, users may have varying needs for balancing bias mitigation with overall model capabilities, highlighting the demand for methods that enable controllable bias reduction…

この記事の続きは原文サイトでお読みいただけます。

原文を読む →