AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

Gemma-4で音声処理がllama-serverに導入

Reddit r/LocalLLaMA / 2026/4/13

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

原文を読む →

共有:

要点

llama.cppのllama-serverに、Gemma-4のE2AおよびE4Aモデルを用いた音声認識（STT）による音声処理サポートが追加されました。
これにより、ローカルのLLMサーバーの機能がテキスト生成にとどまらず、音声入力からの文字起こし（転写）まで含むように拡張されます。
このアップデートはLocalLLaMAコミュニティで報告されており、オンデバイスまたはセルフホスト運用に向けた新しい能力が強調されています。
llama-serverを統合するユーザーは、同一のサーバースタック内で、Gemma-4を活用したSTTワークフローに音声をルーティングできるようになりました。

Audio processing landed in llama-server with Gemma-4

https://preview.redd.it/lsuwsm085sug1.png?width=1588&format=png&auto=webp&s=e87631511cd85977a9dbfa1cd8283a7bb0280538

皆さん、素晴らしいお知らせです。llama.cpp（llama-server）が、Gemma-4 の E2A および E4A モデルで STT をサポートするようになりました。

submitted by /u/srigi
[link] [comments]

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/13Dailyインサイトを見る →

関連記事

Black Hat USA

Black Hat USA

AI Business

Black Hat Asia

Black Hat Asia

AI Business

日本三大秘境の現場で最先端技術の活用、建機の遠隔・自律操作

日本三大秘境の現場で最先端技術の活用、建機の遠隔・自律操作

日経XTECH

ヒューマノイドが建設現場にやってくる、フィジカルAIは人手不足を救うか

ヒューマノイドが建設現場にやってくる、フィジカルAIは人手不足を救うか

日経XTECH

人型ロボット、中国が圧倒的に先行日本はコア部品技術で挽回へ

人型ロボット、中国が圧倒的に先行日本はコア部品技術で挽回へ

日経XTECH

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告