Responses APIでWebSocketを使ってエージェント型ワークフローを高速化する

OpenAI Blog / 2026/4/22

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical Usage

要点

  • 記事では「Codex agent loop」を解説し、WebSocketによってエージェント型ワークフロー内のやり取りを効率化し、反復されるAPIのオーバーヘッドを減らす方法を示します。
  • 接続スコープのキャッシュ(connection-scoped caching)を使ってセッション中に関連するコンテキストを再利用し、レイテンシ低下につなげる仕組みが説明されています。
  • Responses APIにおける具体的なアーキテクチャ上の選択肢に焦点を当て、モデルの応答を体感レベルで改善する考え方が述べられています。
  • 全体として、WebSocketを前提にセッションを考慮した設計が、よりステートレスなリクエストパターンよりエージェント実行を速められると位置づけています。
Codexエージェントループを深掘りし、WebSocketsと接続スコープに基づくキャッシュによってAPIのオーバーヘッドがどのように削減され、モデルのレイテンシがどのように改善されたかを示します。