LLMエージェントにおける多層インストラクション階層

arXiv cs.CL / 2026/4/13

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLMエージェントにおける現在のインストラクション階層アプローチが、通常は小さく固定された特権レベルの集合のみを前提としており、現実の複数ソースのエージェント環境では破綻してしまうと主張している。
任意の数の特権レベルを持つ命令間の競合を解決しつつ、最上位の特権を持つ命令を優先することを目的とした、多層インストラクション階層（ManyIH）を提案する。
著者らは、競合する命令が最大12レベルまで存在する新しいベンチマークであるManyIH-Benchを導入し、コーディングおよび命令追従のシナリオにまたがる853のエージェント課題を含めている。
ManyIH-Benchでは、LLMによって生成された制約を人間が検証することで、実在の46のエージェントから導出された、現実的で難易度の高いテストケースを作成する。
実験の結果、最先端モデルであっても命令の競合がスケールすると約40%の精度にとどまることが示されており、エージェントシステムにおいてより頑健で微細な競合解決手法が必要であることが示唆される。

AI Business

日経XTECH

日経XTECH

日経XTECH

日経XTECH