OpenAI、Realtime APIで3つのリアルタイム音声モデル(GPT-Realtime-2 / GPT-Realtime-Translate / GPT-Realtime-Whisper)を提供開始

MarkTechPost / 2026/5/8

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • OpenAIは、Realtime APIで利用可能な3つの目的特化型リアルタイム音声モデル(GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper)をリリースしました。
  • GPT-Realtime-2は、リアルタイム音声の推論エージェントを可能にすることを狙っています。
  • GPT-Realtime-Translateは、70以上の言語で話し言葉をリアルタイムに翻訳でき、対話的な翻訳ユースケースに対応します。
  • GPT-Realtime-Whisperは、ストリーミングによる文字起こしに焦点を当て、音声をリアルタイムに書き起こせます。

この記事の続きは原文サイトでお読みいただけます。

原文を読む →

OpenAI、Realtime APIで3つのリアルタイム音声モデル(GPT-Realtime-2 / GPT-Realtime-Translate / GPT-Realtime-Whisper)を提供開始 | AI Navigate