24時間365日稼働するAI動画工場を作った—完全オープンソース

Dev.to / 2026/5/9

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • この記事では、トレンドの発見から台本作成、TTSによるナレーション生成、Bロール収集、FFmpegでの動画レンダリング、YouTubeへの自動アップロードまでを24時間365日で行う、オープンソースの自動YouTube「AI動画工場」が紹介されています。
  • 重要な差別化ポイントは「Dual Parallel AI(デュアル並列AI)による台本作成」で、QwenとOllamaを同時に動かし、互いをクロススコアリングして制作前に低品質な出力(AIのスロップ)を減らす仕組みです。
  • ワークフローは12段階のパイプラインとして整理されており、トレンド検知、フック挿入、コンテンツの重複を避けるメモリ、Webリサーチ、連載生成、シネマティックなFFmpegレンダリング、さらにサムネイル/CTR最適化などをカバーします。
  • 著者は、動画編集に8時間以上かかっていたことや編集者の人件費が高いこと、既存のAIツールの出力が一般的すぎることを背景にこの仕組みを作った動機を説明し、OllamaとFFmpegがあれば動かせるクイックスタートも共有しています。
  • このプロジェクトはPython 3.11、FFmpeg、Ollama、Qwen、F5-TTSで構築され、MITライセンスでリポジトリが公開されています。

私が作ってきたプロジェクトを共有したいと思います:Mesin Cuan Viral Architect — 完全自動のYouTubeコンテンツパイプラインです。

それができること:
トレンドトピックを発見し、デュアル並列AIでスクリプトを書き、TTS音声のナレーションを生成し、B-roll映像を取得し、FFmpegでシネマティックな動画をレンダリングして、YouTubeにアップロードします——すべて自律的に、24/7で稼働します。

秘密の要—デュアル並列AIスクリプティング:
ほとんどのAIコンテンツツールは、単一のLLM → 一般的な出力を使います。Mesin CuanはQwenとOllamaを同時に動かし、その後互いにクロススコアリングして、生産前にAIの“なま物感(AI slop)”を排除します。スコアが高いスクリプトが勝ちます。

12エンジンのパイプライン:

  • Viral Loop Engine — リアルタイムのトレンド検知
  • Dual Parallel AI — Qwen + Ollama のクロススコアリング
  • Script Quality Scorer — 多次元での検証
  • Hook Engine — 高い視聴維持率を狙うオープニングを自動で注入
  • Memory Engine — コンテンツを二度と繰り返さない
  • Research Engine — スクリプト作成の前にWebリサーチ
  • Series Engine — 複数パートのコンテンツを自動生成
  • Neon Visuals — シネマティックなFFmpegレンダリング
  • Smart SFX Mixer — ニッチに応じた効果音
  • Thumbnail Intelligence — AIによるCTR最適化
  • OAuth2 Analytics — チャンネルごとの視聴維持ダッシュボード
  • Pipeline Estimator — バッチレンダリングのETA予測

なぜこれを作ったのか:
私は1本の動画を編集するのに8時間以上かかっていました。編集者を雇うのは高すぎて、既存のAIツールは一般的なコンテンツしか生成できませんでした。そこで、自分の動画工場を作りました。

テックスタック: Python 3.11 + FFmpeg + Ollama + Qwen + F5-TTS

クイックスタート(Ollama + FFmpegだけでOK):

git clone https://github.com/algojogacor/mesin-cuan.git
cd mesin-cuan
python main.py --channel ch_id_horror --skip-qc

リポジトリ: https://github.com/algojogacor/mesin-cuan

MIT License — 無料で使用、改変、配布できます。18歳のときに一人で作りました。