Chorus v1:重なり合う話者の音声文字起こし

Reddit r/LocalLLaMA / 2026/4/20

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • Chorus v1は、単一モデルで複数話者の重なり合う音声を文字起こしすることを目的とした、新しいオープンウェイトのモデルです。
  • PyTorch用の重みが提供されており、一般的なMLワークフローをサポートするとともに、ローカル推論などにも対応しやすいGGML重みも用意されています。
  • 既存のWhisper系コマンドライン文字起こしツールへの統合を助けるために、whisper-cliのパッチが同梱されています。
  • モデルと関連成果物はHugging Faceで公開されており、コミュニティによる試用やローカル展開を想定していることがうかがえます。

単一モデルで複数話者の文字起こしを可能にする、新しいオープンウェイトのモデル。PyTorchと、ここで提供されるggmlのウェイトおよびwhisper-cliのパッチです。

投稿者 /u/TrelisResearch
[リンク] [コメント]