Aethon：ステートフルAIエージェントを定数時間で生成するための参照ベース複製プリミティブ

arXiv cs.AI / 2026/4/15

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

本論文は、ステートレスなLLM推論から、ツールを用いるステートフルなエージェントへ移行することで、現在のAIランタイムの限界が露呈することを主張している。特に、重い生成（インスタンシエーション）に起因するレイテンシとメモリコストの問題が挙げられる。
Aethonは、各インスタンスを完全に実体化するのではなく、安定した定義・階層化されたメモリ・ローカルなコンテキストのオーバーレイに基づく、合成的なビューとしてステートフルなエージェントのインスタンスを生成する参照ベースの複製プリミティブを提案する。
Aethonのアーキテクチャとメモリモデルは、コピーオンライト（copy-on-write）セマンティクスを伴う階層化された継承を用いることで、継承される構造に対する作成コストから生成コストを切り離し、ほぼ定数時間でのインスタンシエーションを可能にする。
著者らは、この設計が計算量、スケーラビリティ、マルチエージェントのオーケストレーション、そしてエンタープライズにおけるガバナンスに与える影響を分析し、参照ベースのインスタンシエーションをプロダクション志向のシステム抽象化として位置づけている。
全体として、Aethonは、エージェントが軽量で合成可能な実行アイデンティティのように振る舞い、大規模にスポーン・特化・統制できるようにするインフラストラクチャのパターンへ向けた一歩として提示される。