「GLaDOS TTS Build Kit」—Portal 1と2を所有している人向けにGLaDOSの声を学習する

Reddit r/LocalLLaMA / 2026/5/3

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 「GLaDOS TTS Build Kit」リポジトリは、PortalおよびPortal 2の自分の所有済みインストールデータだけを使って、ローカルでGLaDOS風のTTS音声を学習できると紹介されています。
  • これは“ソースのみ”を前提にした学習パイプラインで、ローカルのゲームVPKから音声ラインを抽出し、Source音声を24kHz・モノラルのクリーンなPCMへ変換して学習データを作成します。
  • クリップの文字起こしはCohere Transcribe(CohereX経由)で行い、さらにPortal Wikiの文字起こしもスクレイピングしてグラウンドトゥルースとして用い、両方の文字起こしを突き合わせて不一致のクリップを除外します。
  • 問題のあるクリップを手動で確認できる小さなローカルWeb UIも任意で用意され、最後にマニフェストを作成してローカルのOmniVoice TTSモデルを学習します。
  • 著者は、Valveの音声データや抽出済みクリップ、文字起こし、サンプル、チェックポイント、学習済み重みなどは同梱されず、生成物は無視されるローカルのdata/配下に残る点を強調しています。

あなたが手元にインストール済みの Portal および Portal 2 のコピーを使って、ローカルで GLaDOS 風 TTS ボイスを学習するためのリポジトリを組み立てました:

https://github.com/JoeHelbing/glados-tts-build-kit

解説: https://www.joehelbing.net/post/glados-tts

重要な点: これはValve の音声、抽出したクリップ、文字起こし、サンプル、チェックポイント、学習済み重みを含みません。これは単にパイプラインだけです。あなたがローカルのゲームファイルを用意すれば、生成されたものはすべて無視対象のローカル data/ パス配下に留まります。

できること:

  • ローカルの Portal / Portal 2 の VPK から GLaDOS の音声ラインを抽出する
  • Source の「WAV 内 MP3」ファイルを、きれいな 24 kHz モノ PCM に変換する
  • CohereX を通じて Cohere Transcribe でクリップを文字起こしする
  • Portal Wiki の文字起こしをグラウンドトゥルース参照としてスクレイピングする
  • 2 つの文字起こしソースを突き合わせ、良くない/一致しないクリップをフィルタする
  • (任意)ごちゃごちゃしたクリップを手で確認できる小さなローカル Web UI を提供する
  • マニフェストを作成し、ローカルの OmniVoice TTS モデルを学習する

要するに、誰かのデータセットやモデル重みをダウンロードするのではなく、すでにゲームを持っている人がローカルでパイプラインを再現して実行できるものが欲しかったのです。

謝辞: 元々のゲームファイル抽出というアイデアは systemofapwne/piper-de-glados から得たもので、その後、このバージョンを「ソースのみ」のフル学習パイプラインの周りに組み立てました。

によって投稿 /u/Mr_International
[link] [comments]