Fatigue-Aware Learning to Defer via Constrained Optimisation
arXiv cs.LG / 2026/4/2
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、静的な専門家の正確さを仮定するのではなく、作業負荷に依存して人間のパフォーマンスが低下することを考慮した、疲労を意識する学習にもとづく「延期(Learning to Defer: L2D)」手法FALCONを提案する。
- FALCONは、タスク特徴に加えて累積的な人間の作業負荷を含む状態を用いてL2Dを制約付きマルコフ決定過程(CMDP)として定式化し、協調・カバレッジの予算を制約として精度を最適化するために、PPO-Lagrangianによる学習を行う。
- 著者らは、疲労ダイナミクスをほぼ静的なものから急速に低下するものまで変化させるベンチマークFA-L2Dを提案し、異なる人間の疲労パターンのもとでの頑健性を検証する。
- 複数のデータセットでの実験により、FALCONはカバレッジの異なる条件でも既存のL2D手法より改善し、疲労行動が異なる未見の専門家に対してもゼロショットで汎化できることが示される。また、カバレッジが0から1の範囲にあるとき、人間とAIの協調はAIのみ、または人間のみよりも適応的に優れることが分かる。

