| この数週間の週末を使い、Qwen3 TTSの実装に取り組んできました。これは https://github.com/predict-woo/qwen3-tts.cpp のフォークですが、機能を追加し、コードベースをよりクリーンにしたものです: https://github.com/Danmoreng/qwen3-tts.cpp 現在対応している機能:
また、Kotlin Multiplatformを使用して、これのデスクトップアプリUIも作成しました: https://github.com/Danmoreng/qwen-tts-studio このアプリはソースからのコンパイルが必要で、WindowsとLinuxで動作します。モデルはまだ手動でGGUFへ変換する必要があります。 両方のリポジトリにはまだ仕上げが不足しています。ただし、ここに投稿しても良いと感じる状態です。 [リンク] [コメント] |
C++での Qwen3 TTS:1.7B 対応、話者エンコーディング抽出、デスクトップUI
Reddit r/LocalLLaMA / 2026/3/15
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage
要点
- Qwen3 TTSのC++版のForkが、1.7Bモデル対応、話者エンコーディング抽出、JNIインターフェース、および話者指示(カスタム音声モデル)を追加。
- WindowsとLinuxでローカルにTTSを実行・テストするためのデスクトップアプリUIをKotlin Multiplatform(qwen-tts-studio)で構築しました。
- このプロジェクトはソースからのコンパイルが必要で、モデルの手動GGUF変換が必要で、DIYワークフローと設定手順を示しています。
- この投稿はGitHubリポジトリとプレビュー画像を提示しており、作業をフィードバックのためのまだ進行中の貢献として位置づけています。
関連記事
日産、E2Eロボタクシーで「水平分業」 ウーバー・NVIDIAと対テスラ
日経XTECH
ブームの裏で制御AI未導入54%、工場の自動化阻むコストと人材不足
日経XTECH

「支払われなければ通報せよ」改正建設業法/日系車部品の失注相次ぐ「bZショック」など、注目記事を音声化しました
日経XTECH
State of MCP Security 2026: We Scanned 15,923 AI Tools. Here's What We Found.
Dev.to
I Built a Zombie Process Killer Because Claude Code Ate 14GB of My RAM
Dev.to