OpenAI、Realtime APIで3つのリアルタイム音声モデル(GPT-Realtime-2 / GPT-Realtime-Translate / GPT-Realtime-Whisper)を提供開始
MarkTechPost / 2026/5/8
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageIndustry & Market MovesModels & Research
要点
- OpenAIは、Realtime APIで利用可能な3つの目的特化型リアルタイム音声モデル(GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper)をリリースしました。
- GPT-Realtime-2は、リアルタイム音声の推論エージェントを可能にすることを狙っています。
- GPT-Realtime-Translateは、70以上の言語で話し言葉をリアルタイムに翻訳でき、対話的な翻訳ユースケースに対応します。
- GPT-Realtime-Whisperは、ストリーミングによる文字起こしに焦点を当て、音声をリアルタイムに書き起こせます。
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



