AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

「GLaDOS TTS Build Kit」—Portal 1と2を所有している人向けにGLaDOSの声を学習する

Reddit r/LocalLLaMA / 2026/5/3

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

原文を読む →

共有:

要点

「GLaDOS TTS Build Kit」リポジトリは、PortalおよびPortal 2の自分の所有済みインストールデータだけを使って、ローカルでGLaDOS風のTTS音声を学習できると紹介されています。
これは“ソースのみ”を前提にした学習パイプラインで、ローカルのゲームVPKから音声ラインを抽出し、Source音声を24kHz・モノラルのクリーンなPCMへ変換して学習データを作成します。
クリップの文字起こしはCohere Transcribe（CohereX経由）で行い、さらにPortal Wikiの文字起こしもスクレイピングしてグラウンドトゥルースとして用い、両方の文字起こしを突き合わせて不一致のクリップを除外します。
問題のあるクリップを手動で確認できる小さなローカルWeb UIも任意で用意され、最後にマニフェストを作成してローカルのOmniVoice TTSモデルを学習します。
著者は、Valveの音声データや抽出済みクリップ、文字起こし、サンプル、チェックポイント、学習済み重みなどは同梱されず、生成物は無視されるローカルのdata/配下に残る点を強調しています。

あなたが手元にインストール済みの Portal および Portal 2 のコピーを使って、ローカルで GLaDOS 風 TTS ボイスを学習するためのリポジトリを組み立てました：

https://github.com/JoeHelbing/glados-tts-build-kit

解説: https://www.joehelbing.net/post/glados-tts

重要な点: これはValve の音声、抽出したクリップ、文字起こし、サンプル、チェックポイント、学習済み重みを含みません。これは単にパイプラインだけです。あなたがローカルのゲームファイルを用意すれば、生成されたものはすべて無視対象のローカル data/ パス配下に留まります。

できること:

ローカルの Portal / Portal 2 の VPK から GLaDOS の音声ラインを抽出する
Source の「WAV 内 MP3」ファイルを、きれいな 24 kHz モノ PCM に変換する
CohereX を通じて Cohere Transcribe でクリップを文字起こしする
Portal Wiki の文字起こしをグラウンドトゥルース参照としてスクレイピングする
2 つの文字起こしソースを突き合わせ、良くない/一致しないクリップをフィルタする
（任意）ごちゃごちゃしたクリップを手で確認できる小さなローカル Web UI を提供する
マニフェストを作成し、ローカルの OmniVoice TTS モデルを学習する

要するに、誰かのデータセットやモデル重みをダウンロードするのではなく、すでにゲームを持っている人がローカルでパイプラインを再現して実行できるものが欲しかったのです。

謝辞: 元々のゲームファイル抽出というアイデアは systemofapwne/piper-de-glados から得たもので、その後、このバージョンを「ソースのみ」のフル学習パイプラインの周りに組み立てました。

によって投稿 /u/Mr_International
[link] [comments]

関連記事

Black Hat USA

Black Hat USA

AI Business

リコーが日本語性能でGPT-5に匹敵する金融特化型LLMを開発、業務遂行能力を強化

リコーが日本語性能でGPT-5に匹敵する金融特化型LLMを開発、業務遂行能力を強化

日経XTECH

AIでAmazon FBA出品者の特許リスクを自動化する方法

AIでAmazon FBA出品者の特許リスクを自動化する方法

Dev.to

すべてのツールが同じコンテキストを共有する統合型AIワークスペースを作った——Kitを紹介

すべてのツールが同じコンテキストを共有する統合型AIワークスペースを作った——Kitを紹介

Dev.to

Codex v0.128.0：「/goal」が完了まで（しかもセッションをまたいで）機能し続ける

Codex v0.128.0：「/goal」が完了まで（しかもセッションをまたいで）機能し続ける

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告