AI Navigate

インサイト最新記事一覧 AI大全

広告

Cohere Transcribe WebGPU: ブラウザで利用できる最先端の多言語音声認識

Reddit r/LocalLLaMA / 2026/3/28

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Cohereは最初の音声からテキストへのモデルをリリースしました。報告によれば、このモデルは（少なくとも英語において）OpenASRリーダーボードのトップにいる一方で、14言語に対応しています。
開発者がWebGPUのデモを構築し、Transformers.jsを使って書き起こしモデルをブラウザ上で完全にローカルに実行できるようにしています。
デモとそのソースコードはHugging Face Spacesで公開されており、他の人も同様のクライアントサイド音声認識体験を試したり、構築したりできます。
今回のリリースは、高性能な多言語ASRモデルをオンデバイスで動かすことが現実的になりつつあることを強調しており、プライバシーの向上や、ブラウザベースのアプリにおけるレイテンシの低減につながります。

Cohere Transcribe WebGPU: state-of-the-art multilingual speech recognition in your browser

昨日、Cohereは最初の音声認識（speech-to-text）モデルをリリースしました。このモデルは現在、OpenASRのリーダーボードでトップに立っています（英語向けですが、このモデルは14の異なる言語をサポートしています）。

そこで、これ用のWebGPUデモを作ることにしました。Transformers.jsを使って、モデルをブラウザ上で完全にローカルで動かします。気に入っていただければ幸いです！

デモへのリンク（＋ソースコード）： https://huggingface.co/spaces/CohereLabs/Cohere-Transcribe-WebGPU

投稿者 /u/xenovatech
[link] [comments]

関連記事

Black Hat Asia

Black Hat Asia

AI Business

AIの知能の爆発で、人間の薬剤師はどうなる？

AIの知能の爆発で、人間の薬剤師はどうなる？

note

特別養護老人ホームでChatGPTなどの生成ＡＩ（人工知能）を含む文書作成ツールの活用進む都高齢協が調査

特別養護老人ホームでChatGPTなどの生成ＡＩ（人工知能）を含む文書作成ツールの活用進む都高齢協が調査

note

AIで絵本をKindleに出版したら驚きの結果！？副業初心者はコレを実践しろ！

AIで絵本をKindleに出版したら驚きの結果！？副業初心者はコレを実践しろ！

note

🎬AIと子供の感性がハネた！親子で作る『へんがおラップ』製作記

🎬AIと子供の感性がハネた！親子で作る『へんがおラップ』製作記

note

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告