広告

MicrosoftのMAI-Transcribe-1は前モデルより2.5倍高速、音声1時間あたり0.36ドル

THE DECODER / 2026/4/3

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • MicrosoftのMAI-Transcribe-1は、25の言語に対応する音声からテキストへのモデルであり、騒がしい環境でも精度を維持します。
  • 新しいモデルは前モデルより約2.5倍高速で、報告によればコストを音声1時間あたり0.36ドルにまで抑えています。
  • MicrosoftはMAI-Transcribe-1をすでに自社製品の中で使用しており、研究段階のみにとどまらない近い将来の導入が示唆されています。
  • このリリースにより、MAI-Transcribe-1は、リアルタイムまたは大規模な処理を必要とする文字起こしワークロードに向けた、より費用対効果が高く高スループットな選択肢として位置づけられています。

マイクロソフトのロゴの抽象的なバージョン

MAI-Transcribe-1は、25の言語で、周囲の雑音があっても音声を素早くかつ正確に文字起こしします。Microsoftはすでに、このモデルを自社製品で使用しています。

この記事 Microsoft's MAI-Transcribe-1は、1オーディオ時間あたり$0.36で、前身より2.5倍高速に動作しますThe Decoder に最初に掲載されました。

広告