AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

Chorus v1：重なり合う話者の音声文字起こし

Reddit r/LocalLLaMA / 2026/4/20

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Chorus v1は、単一モデルで複数話者の重なり合う音声を文字起こしすることを目的とした、新しいオープンウェイトのモデルです。
PyTorch用の重みが提供されており、一般的なMLワークフローをサポートするとともに、ローカル推論などにも対応しやすいGGML重みも用意されています。
既存のWhisper系コマンドライン文字起こしツールへの統合を助けるために、whisper-cliのパッチが同梱されています。
モデルと関連成果物はHugging Faceで公開されており、コミュニティによる試用やローカル展開を想定していることがうかがえます。

単一モデルで複数話者の文字起こしを可能にする、新しいオープンウェイトのモデル。PyTorchと、ここで提供されるggmlのウェイトおよびwhisper-cliのパッチです。

投稿者 /u/TrelisResearch
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

ブラックハット・アジア

ブラックハット・アジア

AI Business

オープン・ウェイト・モデル完全ガイド：オープンソースLLMの実務者向け手引き（2026年版）

Reddit r/MachineLearning

エンタープライズAI戦略コンサルティング

Dev.to

「Mythos vs GPT-5.4-Cyber」の議論がベンチマークを欠いている理由

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告