コーディング・エージェントは有効な長文脈プロセッサである
arXiv cs.CL / 2026/3/24
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMにおける現在の長文脈性能が低下するのは、潜在的で解釈不能な注意(attention)が長い文書を処理する仕組みとして有効ではないためだと主張する。
- 長文脈処理を、コード実行可能な明示的な相互作用として外部化することを提案する。具体的には、テキストをファイルシステム上で整理し、ネイティブのツールで操作するコーディング・エージェントを用いる。
- 長文脈推論、検索拡張生成(RAG)、および最大3兆トークン規模のコーパスに対するオープンドメインQAの評価により、コーディング・エージェントは、先行して公表された最先端手法をベンチマーク平均で17.3%上回ることが示される。
- 著者らは、この改善はコーディング・エージェントのネイティブツールの習熟(実行可能なコード/ターミナルコマンドの利用)と、ファイルシステムへの馴染み(巨大なコーパスをディレクトリ構造として扱うこと)によるものだと考える。
- これらの結果は、長文脈能力を、意味検索やコンテキストウィンドウの単純なスケーリングのみに頼らずに向上させられることを示唆しており、LLMシステムにおける新たな長文脈処理の方向性につながる。