AI Navigate

アップデートアップデート最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

ささやき声を聞き取るのに最適な小型の音声認識（STT）モデルは？

Reddit r/LocalLLaMA / 2026/5/20

💬 オピニオンIdeas & Deep AnalysisTools & Practical Usage

原文を読む →

共有:

要点

投稿では、ミッドレンジのスマホ上で動かせる小型の音声認識（STT）モデルとして、ささやき声を最もよく認識できるものを探しています。
社内外の制約ではなく「実用性」を重視しており、大規模基盤に依存せず端末上で動作することが前提になっています。
さらに、既存のSTTモデルをささやき声に最適化するよう微調整（ファインチューニング）できるのかという点も議題にしています。
背景には、電話に向かって話すことが社会的に適切でない場面での代替手段を見つけたいという狙いがあります。

電話で話すのは、すべての社交的な状況において適切ではありません。

中程度の性能の電話で動かせるSTTモデルで、ささやき声の発話を認識するのが得意なものはどれですか？

既存のSTTモデルを、ささやき声の発話の認識がより得意になるように微調整（finetune）できますか？

ありがとうございます。

によって投稿 /u/crantob
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

AI君、もしかしてやっちまったか？

AI君、もしかしてやっちまったか？

note

Gemini Spark！！PCを閉じても働き続けるAIが登場仕事のやり方が根本から変わる 🔥

Gemini Spark！！PCを閉じても働き続けるAIが登場仕事のやり方が根本から変わる 🔥

note

学習データは取り終わった〜Meta 8,000人解雇のタイミングが示すもの

学習データは取り終わった〜Meta 8,000人解雇のタイミングが示すもの

note

国内AIエージェント動向(2026/5/20号)

国内AIエージェント動向(2026/5/20号)

note

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告