あなたが手元にインストール済みの Portal および Portal 2 のコピーを使って、ローカルで GLaDOS 風 TTS ボイスを学習するためのリポジトリを組み立てました:
https://github.com/JoeHelbing/glados-tts-build-kit
解説: https://www.joehelbing.net/post/glados-tts
重要な点: これはValve の音声、抽出したクリップ、文字起こし、サンプル、チェックポイント、学習済み重みを含みません。これは単にパイプラインだけです。あなたがローカルのゲームファイルを用意すれば、生成されたものはすべて無視対象のローカル data/ パス配下に留まります。
できること:
- ローカルの Portal / Portal 2 の VPK から GLaDOS の音声ラインを抽出する
- Source の「WAV 内 MP3」ファイルを、きれいな 24 kHz モノ PCM に変換する
- CohereX を通じて Cohere Transcribe でクリップを文字起こしする
- Portal Wiki の文字起こしをグラウンドトゥルース参照としてスクレイピングする
- 2 つの文字起こしソースを突き合わせ、良くない/一致しないクリップをフィルタする
- (任意)ごちゃごちゃしたクリップを手で確認できる小さなローカル Web UI を提供する
- マニフェストを作成し、ローカルの OmniVoice TTS モデルを学習する
要するに、誰かのデータセットやモデル重みをダウンロードするのではなく、すでにゲームを持っている人がローカルでパイプラインを再現して実行できるものが欲しかったのです。
謝辞: 元々のゲームファイル抽出というアイデアは systemofapwne/piper-de-glados から得たもので、その後、このバージョンを「ソースのみ」のフル学習パイプラインの周りに組み立てました。
[link] [comments]




