日本語にも対応したオープンソースの文字起こし専用音声認識モデル「Transcribe」をCohereが発表

GIGAZINE / 2026/3/27

📰 ニュースTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • Cohereが、日本語にも対応した文字起こし専用のオープンソース音声認識モデル「Transcribe」を発表した。
  • 文字起こし用途に最適化されたモデルとして、音声入力からテキスト化するワークフローの導入・置き換えを後押しする。
  • 日本語対応を明確に打ち出すことで、多言語音声認識の活用範囲を国内の開発・運用に広げる狙いがある。
  • オープンソースとして提供されるため、既存のASRパイプラインへの組み込みや、チューニング・検証の自由度が高まる。
  • 文字起こしの精度・コスト・運用性に関する選択肢が増え、プロダクト側の音声機能企画にも影響しうる。


AI企業のCohereがオープンソースの音声認識(ASR)モデル「Transcribe」を2026年3月26日に発表しました。このモデルは英語、日本語、中国語、韓国語、ベトナム語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語、ギリシャ語、オランダ語、ポーランド語、アラビア語に対応しており、Hugging Faceからダウンロードできるほか、CohereのAPI経由でも試用できるようになっています。

続きを読む...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →