Leverage Laws:人とエージェントの協働のためのタスク単位フレームワーク

arXiv cs.CL / 2026/4/29

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、人とエージェントの協働を、エージェントによって置き換わる人の作業量を、タスクの指定、実行中の割り込み対応、そして結果のレビューに要する人の時間で割ることで定義する「タスク単位のレバレッジ比」を提案しています。
  • 情報要求が3つの時間コストのチャネルを通じて流れると見なし、人→エージェントとエージェント→人の両方向に対して情報密度の向き付きな上限を示します。
  • 漸近的なレバレッジの振る舞いを解析し、それが「能力」と「メモリ」という2つのスケーリング要因に分解され、さらに計画項には、人間の処理能力により制約される不可避のタスク新規性に由来するゼロでない下限があることを示します。
  • 繰り返しタスクや、生成される下位タスクを扱えるようにして、システム設計投資の償却も織り込んだ「窓(ウィンドウ)単位のレバレッジ指標」に拡張し、タスク単位と窓単位の双方が有界であることを示します。
  • 本フレームワークは、監督的制御、共通理解、混合イニシアチブ相互作用といった先行研究の要素を単一の規範的な比として統合し、最後に検証可能な経験的問いを未解決課題として提示しています。

概要:人とアシスタントの協働に対して、タスクごとのレバレッジ比(leverage ratio)を提案します。これは、あるエージェントによって置き換えられた人間の作業量を、タスクを指定するのに必要な人間の時間、実行途中で発生する中断(interrupt)を解消するための時間、そして結果を確認する時間で割ったものです。分母は、保存されるタスクごとの情報要求が流れ込まなければならない3つのチャネルへと分解され、それぞれに固有の時間コストのスカラーが割り当てられます。情報密度そのものが方向性を持ち、人からエージェントへの流れとエージェントから人への流れそれぞれに対する別個の上限によって有界であること、さらにレバレッジの漸近挙動が2つのスケーリング軸(能力とメモリ)へと分解されることを示します。また、計画項(planning term)にはゼロでない下限が存在し、その下限は、人間のスループットによって上界づけられる、不可避なタスクの新規性(irreducible task novelty)によって設定されます。このタスクごとの分析を、反復するタスク、生成されるサブタスク(spawned subtasks)、および償却されるシステム設計への投資を考慮できる窓付きのレバレッジ指標へ拡張します。タスクごとの上限は窓付き指標には束縛しませんが、両者とも有界です:L_{\text{task}}はタスクごとの新規性によって有界であり、L_{\text{window}}は、その窓の中で支払われる(pays out)計画投資の蓄積量によって有界です。この枠組みは、監督的制御(Sheridan, 1992)、共通基盤(Clark & Brennan, 1991)、および混合イニシアティブ相互作用(Horvitz, 1999)といった先行研究の質的側面を、単一の規範的比率の中で実装(operationalize)し、さらに、我々が未解決の問題として残す、検証可能な経験的問いのリストを提示します。