平均の彼方へ:二峰性回帰のための分布を考慮した損失関数
arXiv cs.AI / 2026/3/25
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、二峰性回帰における重要な不確実性推定問題を扱う。学習された表現から得られる誤差は、確信度の高い予測と曖昧な予測の両方が存在するため、二峰性分布に従う。
- 著者らは、標準的な回帰損失は暗黙に一峰性のガウスノイズを仮定しており、その結果として「平均崩壊(mean-collapse)」が起こりやすく、二峰性の状況で予測不確実性を適切に表現できないと主張する。
- 著者らは、正規化RMSEとワッサースタイン距離およびクレーマー距離を組み合わせた、分布を考慮した損失関数を提案し、二峰性の予測分布をより良くモデル化する。
- 4つの評価段階にわたる実験により、本手法は、混合密度ネットワーク(MDN)に典型的な最適化の不安定さなしに、標準的な深層回帰アーキテクチャで二峰性分布を復元できることが示される。
- 結果として、ワッサースタイン距離に基づく損失はパレート効率の利点をもたらす。つまり、一峰性タスクではMSEに近い安定性を維持しつつ、複雑な二峰性データセットではジェンセン=シャノン距離を45%低減できる。また、尤もらしい(aleatoric)不確実性推定において、MDNよりも忠実性と頑健性の両面で優れている。
