スキルテキストからスキル構造へ:エージェントスキルのスケジューリング・構造・論理表現(SSL)

arXiv cs.CL / 2026/4/28

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMエージェントの「スキル」が多くの場合テキスト中心の成果物として管理され、機械が扱うべき根拠が自然言語の記述に埋め込まれているため、呼び出しインターフェースや副作用をエージェントが推論しづらいと指摘している。
  • スケジューリング・構造・論理(SSL)表現を提案し、スキルのスケジューリング情報、場面(シーン)レベルの実行構造、そして論理レベルの行動・リソース使用の根拠を明示的な構造に分解して扱う。
  • SSLはLLMベースの正規化器を用いて実装され、Skill DiscoveryとRisk Assessmentの2つのタスクでスキルコーパスに評価されている。
  • SSLはテキストのみのベースラインを上回り、Skill DiscoveryではMRRが0.573から0.707に、Risk AssessmentではマクロF1が0.744から0.787に改善した。
  • 明示的で出所に根ざした構造により、エージェントスキルの検索やレビュー、再利用が容易になることが示唆され、SSLは最終標準というより検査可能で運用可能なスキル表現へ向けた実務的な一歩として位置づけられている。

要旨: LLMエージェントは、再利用可能なスキルにますます依存するようになってきています。スキルとは、指示、制御フロー、制約、そしてツール呼び出しを組み合わせた能力パッケージです。しかし、現在のほとんどのエージェントシステムでは、スキルは依然としてテキスト中心の成果物として表現されており、SKILL{.}md形式の文書や、機械が利用可能な根拠(エビデンス)が主として自然言語の記述の中に埋め込まれた構造化レコードが含まれます。これは、スキル中心のエージェントシステムにとっての課題となります。すなわち、スキルの集合を管理し、スキルを用いてエージェントを支援するには、呼び出しインターフェース、実行の構造、そして多くの場合に単一のテキスト表面に絡み合っている具体的な副作用について推論する必要があります。したがって、スキル知識の明示的な表現は、これらの成果物を機械が獲得し活用しやすくするのに役立つ可能性があります。メモリ編成パケット、スクリプト理論、そしてSchankとAbelsonによる言語知識表現に関する古典的研究における概念依存(Conceptual Dependency)を基に、私たちは、私たちの知る限り、エージェントのスキル成果物のために、スキルレベルのスケジューリング信号、シーンレベルの実行構造、そして論理レベルの行動・資源使用に関する根拠(エビデンス)を切り離す最初の構造化表現を導入します。それがスケジューリング―構造―論理(SSL)表現です。私たちはSSLをLLMベースの正規化器で実装し、スキル発見(Skill Discovery)とリスク評価(Risk Assessment)の2つのタスクにおけるスキルのコーパスで評価しました。その結果、テキストのみのベースラインを上回る性能が得られます。スキル発見では、SSLがMRRを0.573から0.707へ改善し、リスク評価ではマクロF1を0.744から0.787へ改善しました。これらの結果は、明示的でソースに根差した構造が、エージェントのスキルをより検索しやすく、またレビューしやすくすることを示しています。さらに、SSLは、エージェントシステムのための、より検査可能で再利用可能な、そして運用上実行可能なスキル表現へ向けた実践的な一歩として最もよく理解されるものであり、スキルを管理し活用するための完成された標準規格や、エンドツーエンドのメカニズムとして理解されるべきものではないことも示唆しています。