IntentScore: Intent-Conditioned Action Evaluation for Computer-Use Agents
arXiv cs.AI / 4/8/2026
📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- 提案論文「IntentScore」は、Computer-Use Agentsが行う候補アクションの質を評価せずに実行してしまい、取り返しのつかない誤りが連鎖する問題に対処するプラン認識型の報酬モデルを提示しています。
- IntentScoreは、3つのOSにまたがる398K件のオフラインGUI操作ステップから学習し、(1)状態-行動の関連性を高めるコントラスティブ整合と、(2)行動の正しさを順位付けするマージンランキングの2つの目的で訓練します。
- アーキテクチャとして、候補アクションに含まれる「計画上の意図」をアクションエンコーダに埋め込み、類似した操作でも異なる合理(意図)に基づく候補を識別できるようにしています。
- Held-out評価で97.5%のペアワイズ判別精度を達成し、学習で未遭遇のOSWorld環境でAgent S3のリランカーとして用いるとタスク成功率が6.9ポイント向上したことが示されています。
Related Articles

Black Hat Asia
AI Business
[N] Just found out that Milla Jovovich is a dev, invested in AI, and just open sourced a project
Reddit r/MachineLearning

ALTK‑Evolve: On‑the‑Job Learning for AI Agents
Hugging Face Blog

Context Windows Are Getting Absurd — And That's a Good Thing
Dev.to

Every AI Agent Registry in 2026, Compared
Dev.to