エージェント SDK の次の進化

OpenAI Blog / 2026/4/15

📰 ニュースDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • 更新された Agents SDK により、開発者はファイルを検査し、シェルコマンドを実行し、コードを編集できる AI エージェントを構築できます。
  • 複数ステップの作業を、長い相互作用の中で調整することで、長期(ロングホライズン)のタスクを行うエージェントをサポートします。
  • この SDK は、エージェントがファイルを扱ったりコマンドを実行したりする際のリスクを低減するため、管理されたサンドボックス環境内で動作するように設計されています。
  • 今回のリリースは、実運用に即したエージェント開発ワークフローを対象としており、(ファイル/コードの操作やコマンド実行といった) 運用上の機能をエージェントアプリケーションとしてパッケージ化しやすくします。

2026年4月15日

製品

Agents SDKの次なる進化

更新されたAgents SDKは、開発者がファイルを調べ、コマンドを実行し、コードを編集し、制御されたサンドボックス環境内で長期的なタスクに取り組めるエージェントを構築するのを支援します。

読み込み中…
共有

私たちは、Agents SDK(新しいウィンドウで開きます)に、新しい機能を導入します。これにより、開発者は、すぐに始められて、OpenAIモデル向けに正しく作られた標準化されたインフラを利用できます。具体的には、モデルネイティブなハーネスによって、エージェントがコンピュータ上の複数のファイルやツールにまたがって作業できるようになり、さらに、その作業を安全に実行するためのネイティブなサンドボックス実行が提供されます。

たとえば、開発者はエージェントに、制御されたワークスペース、明確な指示、そして証拠を調べるために必要なツールを与えることができます:

Python

1
# pip install "openai-agents>=0.14.0"
2

3
import asyncio
4
import tempfile
5
from pathlib import Path
6

7
from agents import Runner
8
from agents.run import RunConfig
9
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
10
from agents.sandbox.entries import LocalDir
11
from agents.sandbox.sandboxes import UnixLocalSandboxClient
12

13

14
async def main() -> None:
15
with tempfile.TemporaryDirectory() as tmp:
16
dataroom = Path(tmp) / "dataroom"
17
dataroom.mkdir()
18
(dataroom / "metrics.md").write_text(
19
"""# 年間指標
20

21
| 年度 | 売上高 | 営業利益 | 営業キャッシュフロー |
22
| --- | ---: | ---: | ---: |
23
| FY2025 | $124.3M | $18.6M | $24.1M |
24
| FY2024 | $98.7M | $12.4M | $17.9M |
25
""",
26
encoding="utf-8",
27
)
28

29
agent = SandboxAgent(
30
name="Dataroom Analyst",
31
model="gpt-5.4",
32
instructions="data/ のみのファイルを使って回答してください。出典のファイル名を引用してください。",
33
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
34
)
35

36
result = await Runner.run(
37
agent,
38
"FY2025 の売上高、営業利益、営業キャッシュフローを FY2024 と比較してください。",
39
run_config=RunConfig(
40
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
41
),
42
)
43
print(result.final_output)
44

45

46
if __name__ == "__main__":
47
asyncio.run(main())
48

開発者は、有用なエージェントを構築するのに、最良のモデルだけでは不十分です。エージェントがファイルをどのように調査し、コマンドを実行し、コードを書き、さらに多くのステップにわたって動き続けるためのシステムが必要です。

現在存在するシステムには、チームがプロトタイプから本番へ移行する過程でトレードオフがあります。モデル非依存のフレームワークは柔軟ですが、最先端モデルの能力を十分に活用できません。モデル提供事業者のSDKは、モデルにより近いところまで実装できますが、ハーネスへの可視性が十分にないことがよくあります。そしてマネージドなエージェントAPIは、デプロイを簡素化できますが、エージェントをどこで実行するか、また機密性の高いデータにどのようにアクセスするかを制約します。

ここでは、私たちと新しいSDKをテストした一部のお客様の声をご紹介します:

“更新されたAgents SDKにより、これまでのアプローチでは信頼性の面で十分に対応できなかった、重要な臨床記録のワークフローを自動化することが本番レベルで実現可能になりました。私たちにとっての違いは、適切なメタデータを抽出することだけではありませんでした。長く複雑な記録の中で、各受診(エンカウンター)の境界を正しく理解できたことが決定的でした。その結果、各来院におけるそれぞれの患者に対して何が起きているのかをより迅速に把握できるようになり、ケアに関するニーズに取り組むメンバーを支援でき、私たちとの体験を改善することにもつながっています。”
— Rachael Burns、Staff Engineer & AI Tech Lead、Oscar Health

エージェントループのための、より高機能なハーネス

今回のリリースにより、Agents SDKのハーネスは、ドキュメント、ファイル、システムを扱うエージェント向けに、より高い能力を備えるようになりました。設定可能なメモリ、サンドボックスを意識したオーケストレーション、Codexのようなファイルシステムツール、そして最前線のエージェントシステムで一般的になりつつあるプリミティブとの標準化された統合が備わっています。

これらのプリミティブには、 MCP(新しいウィンドウで開きます) を介したツールの利用、 skills(新しいウィンドウで開きます) による段階的な開示、 AGENTS.md(新しいウィンドウで開きます) を介したカスタム指示、 shell(新しいウィンドウで開きます) ツールによるコード実行、 apply patch(新しいウィンドウで開きます) ツールによるファイル編集などがあります。ハーネスは今後も、時間の経過とともに新しいエージェントらしいパターンやプリミティブを取り込み続けます。これにより、開発者はコアとなるインフラの更新に費やす時間を減らし、エージェントを有用にするドメイン固有のロジックにより多くの時間を割けるようになります。

Agent SDK が、ユーザー入力・モデル・ツールをどのように接続して AI エージェントを構築するかを示す図。
モデル、ツール、オーケストレーションを使ってAgent SDKでAIエージェントを構築する方法を示す図。

また、このハーネスは、モデルの能力のさらなる可能性を引き出すのに役立ちます。具体的には、そのモデルが最も得意とする動作の仕方に合わせて実行を調整することで、開発者がフロンティアモデルの能力をより活用できるようにします。これにより、エージェントはモデル本来の動作パターンにより近づきます。その結果、複雑なタスク—とりわけ、作業が長時間にわたる場合や、多種多様なツールやシステムにまたがって連携する場合—での信頼性とパフォーマンスが向上します。

さらに、どの製品もそれぞれ固有で、型にはきれいに収まることはほとんどありません。私たちはAgents SDKを、この多様性を支えるように設計しました。開発者は、導入可能な(すぐに使い始められる)一方で柔軟性も備えたハーネスを手に入れられます。これにより、ツールの利用、メモリ、サンドボックス環境など、自社のスタックに合わせて適応することが簡単になります。

ネイティブ・サンドボックス実行

更新された Agents SDK はサンドボックス実行をネイティブにサポートしているため、エージェントはタスクに必要なファイル、ツール、依存関係を備えた状態で、制御されたコンピュータ環境内で実行できます。

多くの有用なエージェントには、ファイルの読み書き、依存関係のインストール、コードの実行、そしてツールの安全な利用ができるワークスペースが必要です。ネイティブのサンドボックスサポートにより、開発者はそれらを自分で組み立てるよう強いられることなく、すぐに使える実行レイヤーを手に入れられます。

開発者は自前のサンドボックスを持ち込むことも、Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel 向けの組み込みサポートを利用することもできます。

これらの環境をプロバイダー間でポータブルにするために、SDK はエージェントのワークスペースを記述するための Manifest 抽象化も導入しています。開発者はローカルファイルをマウントしたり、出力ディレクトリを定義したり、AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2 などのストレージプロバイダーからデータを持ち込んだりできます。

これにより、ローカルでのプロトタイプから本番環境へのデプロイまで、エージェントの環境を一貫した方法で形作れるようになります。また、モデルにとっても予測可能なワークスペースが提供されます。入力をどこで見つけ、出力を書き込む場所はどこか、そして長時間にわたるタスクにわたって作業をどのように整理しておくか、が明確になります。

Daytona、E2B、Modal、Cloudflare、Vercel、Blaxel、Runloop のロゴ

セキュリティ、耐久性、スケールのためにハーネスと計算を分離する

エージェントシステムは、プロンプトインジェクションやデータ流出(exfiltration)の試みを前提として設計すべきです。ハーネスと計算(compute)を分離することで、モデルが生成したコードが実行される環境から資格情報(credentials)を隔離できます。

さらに、耐久性(durable)を実現します。エージェントの状態(state)を外部化しておけば、サンドボックスコンテナを失っても実行(run)を失うことにはなりません。組み込みのスナップショットと再水和(rehydration)により、Agents SDKは新しいコンテナでエージェントの状態を復元し、元の環境が失敗したり期限切れになったりしても、最後のチェックポイントから処理を継続できます。

最後に、エージェントをよりスケーラブルにします。エージェントの実行(run)は、1つのサンドボックス、または複数のサンドボックスを使用できます。必要なときだけサンドボックスを呼び出し、サブエージェントを隔離された環境へルーティングし、コンテナ間で作業を並列化することで、より高速な実行を実現します。

Agent SDKがAIエージェントに対して、より複雑なタスクのために追加の計算リソースを利用できるようにする仕組みを示すフローダイアグラム。
Agent SDKで構築したAIエージェントが、別々の計算システムをオーケストレーションし、より高度なタスクをサポートしつつワークロードを独立して実行できることを示す図。

料金と提供状況

これらの新しい Agents SDK の機能は、一般に API 経由ですべての顧客に提供されており、トークン数とツールの利用に基づく標準的な API 料金が適用されます。

次に何が来るか

私たちは Agents SDK の開発を続けながら、開発者がそれを使って作れるものを引き続き拡張していきます。独自のインフラストラクチャを最小限に抑えつつ、より高性能なエージェントを本番環境に導入しやすくするとともに、開発者がエージェントを自分の環境に適合させるために必要な柔軟性とコントロールは維持します。

新しいハーネスとサンドボックスの機能は、まず Python で提供を開始します。TypeScript の対応は、将来のリリースで予定しています。また、コードモードやサブエージェントなどの追加のエージェント機能を、Python と TypeScript の両方に提供するためにも取り組んでいます。

さらに、より多くのサンドボックス提供者への対応、より多くの連携、そして開発者がすでに使っているツールやシステムに SDK を組み込むための方法を増やすことで、時間をかけてより幅広いエージェントのエコシステムを一つにまとめることにも貢献したいと考えています。