コーディングエージェントに“声”を!オープンソースでローカル実行

Reddit r/LocalLLaMA / 2026/4/28

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • このプロジェクトは、オープンソースのローカル実行型PythonデーモンとmacOSアプリで、コーディングエージェントのストリーミング中の中間出力を音声で読み上げます。
  • `heard run <command>` というフック経由でClaude CodeやCodexなどと連携し、最終サマリーだけでなくツール呼び出し・ステータス更新・失敗まで含めて通知します。
  • TTS(テキスト読み上げ)はデフォルトで、オンデバイスで動作するKokoroを採用し、APIキーやネットワーク呼び出しなしで動かせます。さらに高品質な音声を求める場合はElevenLabsも選択可能です。
  • テレメトリを一切使わず(分析・クラッシュレポート・外部送信なし)、任意でAnthropicキーを使ったHaiku経由の“キャラクター口調”リライトにも対応します。
  • 作成者はフィードバックを募っており、Apache 2.0のライセンスのGitHubリポジトリを通じてレビューやコントリビュートを促しています。

エージェントの出力を(a)第三者に送らずに、または(b)一日中ターミナルを見つめることなく、私のコーディングエージェントが何をしているのかを聞きたかったので、これを作りました。

これは小さなPythonデーモン+macOSアプリで、`heard run <command>` を介して Claude Code、Codex、その他何でもフックし、ストリーミングしながら中間出力を読み上げます。ツール呼び出し、ステータス行、失敗――単なる最終サマリーだけではありません。

- デフォルトのバックエンドはKokoro。端末内で動作し、キー不要、TTSのためのネットワーク呼び出しなし

- プレミアムボイスが欲しい場合のオプションでElevenLabs

- Haiku経由のインキャラクター・パーソナライティの書き換え用のオプションのAnthropicキー――入れない場合は

中立的なローカルテンプレート

- テレメトリなし。分析なし、クラッシュレポータなし、電話して帰る(phone-home)なし。ソースで検証可能。

- Apache 2.0

できる限りフィードバックが欲しいです。DMかPRでどうぞ!

リポジトリ: https://github.com/heardlabs/heard

投稿者 /u/decentralizedbee
[link] [コメント]