VeriOS：信頼できるOSエージェントのための、問い合わせ駆動型プロアクティブ・ヒューマン—エージェント—GUI相互作用

arXiv cs.CL / 2026/4/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、信頼性の低い現実環境における過剰実行を回避するために、OSエージェントがいつ人の入力を求めるべきかを判断できるよう支援する、人間—エージェント—GUI相互作用のための問い合わせ駆動型フレームワークであるVeriOSを提案する。
3段階の学習アプローチで訓練されたVeriOS-Agentを導入し、教師あり微調整とグループ相対方策最適化によってメタ知識を分離し、活用することを目的とする。
VeriOS-Agentは、通常（信頼できる）条件下では自律的にタスクを実行しつつ、状況が信頼できないと見なされる場合には先回りして人に問い合わせることを意図している。
実験では、強力なベースラインに対して平均のステップごとの成功率が19.72%向上する一方で、通常条件での性能低下はないことが報告されている。
著者らはコード、データセット、モデルを公開し、分析に基づいて合理性、汎化性、スケーラビリティの向上を主張している。