自然言語エージェント・ハーネスの活用

arXiv cs.CL / 2026/3/27

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、エージェントの性能は「ハーネス・エンジニアリング」に大きく依存する一方で、既存のハーネス設計はしばしば制御コードや実行時特有の慣習に組み込まれており、移植性や科学的研究の妨げになっていると主張する。
  • エージェント・ハーネスの高レベルな制御ロジックを、編集可能な自然言語として表現する Natural-Language Agent Harnesses(NLAHs)を提案する。
  • これらのハーネスを、明示的な契約(contract)、耐久性のある成果物、軽量なアダプタによって実行する Intelligent Harness Runtime(IHR)を導入し、移植性を高める。
  • 著者らは、コーディングおよびコンピュータ利用ベンチマークに対して制御された評価を実施し、運用上の実現可能性、モジュールのアブレーション、ハーネスのロジックをコードからテキストへ移行することを検証する。

概要: エージェントの性能はますます
\emph{ハーネス・エンジニアリング} に依存するようになっていますが、ハーネスの設計は通常、コントローラのコードや実行時固有の慣習の中に埋もれているため、科学的な対象として転用・比較・研究することが困難です。私たちは、エージェント・ハーネスの高レベルな制御ロジックを、代わりに携帯可能な実行可能アーティファクトとして外部化できるのかを問いかけます。私たちは、ハーネスのふるまいを編集可能な自然言語で表す
\textbf{自然言語エージェント・ハーネス}(NLAH)と、明示的な契約、耐久性のあるアーティファクト、軽量なアダプタによってこれらのハーネスを実行する共有ランタイムである
\textbf{インテリジェント・ハーネス・ランタイム}(IHR)を提案します。コーディングおよびコンピュータ利用ベンチマークにおいて、運用上の実現可能性、モジュールのアブレーション、およびコードからテキストへのハーネス移行について、統制された評価を行います。

広告