広告

Claude AIで4週間かけて13,000タイトル超のアラビア語ストリーミングガイドを作った

Dev.to / 2026/4/1

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • 開発者が「Shoof Aflam」として、17のプラットフォームにまたがる13,400本以上の作品を収録したアラビア語のストリーミングガイドを、AnthropicのClaudeおよびClaude Codeを使ってほぼ全てのコードをペアプログラミングすることで、約4週間で作り上げた。
  • プロジェクトの技術スタックは、Next.js 16の静的エクスポート、TypeScriptの厳格モード、RTLを最優先にしたTailwindスタイリング、Pythonベースのデータ収集/エンリッチ、そしてビルド前ゲートとしての自動Vitestテストを組み合わせた。
  • Pythonのデータパイプラインにより、TMDB由来のカバレッジを424本から13,400本以上へ拡大。キャスト/スタッフ、トレーラー、評価などのメタデータをエンリッチし、独自のFAQを生成し、アラビア語のあらすじ(翻訳・エンリッチ)を作成した。さらにWikipediaの抜粋やYouTubeのレビュー情報も取り込みつつ、APIのクォータ管理を行った。
  • SEOシステムでは、Claude主導の監査と反復により、Schema.orgのJSON-LDのエンティティタイプを追加し、メタタグやファーチャードスニペットを改善し、「thin content」やnoindex問題を解消した。加えて、フロントエンドとHTTP/2のチューニングによりLCPなどのパフォーマンス指標を最適化した。
  • 案件獲得のアウトリーチ自動化レイヤーは、1台のHetzner VPS上で動作し、ゲスト投稿の発掘、メールのパーソナライズされた提案、バックリンクのモニタリングを行い、Telegramでアラートを送る仕組みも実装された。

私はShoof Aflam — 17のプラットフォームにまたがる13,400本以上の作品を扱う、アラビアの配信ガイド — を1か月もかからずに作りました。秘密は?私はClaude(AnthropicのAI)で全てをコーディングし、データパイプラインからSEO最適化まで、あらゆるコンポーネントをペアプログラミングしました。ここに、ありのままの本当の話があります。

どのように始まったか

私はシンプルな問題を抱えていました。JustWatchに相当する、アラビア語版が存在しなかったのです。アラビア映画やドラマを合法的にどこで視聴できるかを知りたければ、各プラットフォームを手作業で全部確認する必要がありました。中央集約されたガイドはありませんでした。

何か月もかけてアーキテクチャを計画する代わりに、Claude Codeを開いて作り始めました。最初のコミットから13,400本のインデックス済みタイトルまで、プロジェクト全体は約4週間の集中的なペアプログラミングセッションで完成しました。

Claudeで作ったスタック

  • Next.js 16(完全な静的エクスポート付き)— 約7,000の事前レンダリング済みHTMLページ
  • TypeScript 5 厳格モード
  • Tailwind CSS 4(RTL-firstのアラビア語デザイン用)
  • Python 3(TMDB/YouTube/Wikipediaのデータ収集用スクリプト)
  • 129個のVitestテスト(ビルド前のゲートとして強制)
  • Nginx + Cloudflare(Vercelではなく)単一のHetzner VPS上で運用

コードのあらゆる行はClaudeと共同で書きました。私がやりたいことを説明し、Claudeが実装を書き、私はレビューして改善を繰り返しました。いくつかのコンポーネントは、1つのセッションの中で5〜6回改訂されました。

Claudeが実際に作ったもの

ここからは、正直に言うと私たちが一緒に作った内容です:

データパイプライン — 10本以上のPythonスクリプトで、次を行いました:

  • TMDB APIからアラビア語タイトルを大量に発見(424から13,400本以上のタイトルへ)
  • キャスト、スタッフ、トレーラー、評価、制作データで充実化
  • アラビア語のあらすじを取得し、英語のものをGoogle翻訳で翻訳
  • 文化的な文脈のためにWikipediaのアラビア語抜粋を取得
  • 実在するタイトルデータからユニークなFAQエントリを生成(64,800件のうち98.6%がユニーク)
  • 最適化されたAPIクォータ管理でYouTubeのレビューコメントを収集

SEOシステム — Claudeが複数ラウンドの監査を実行し、すべて修正しました:

  • IMDB/TMDBへのsameAsリンク付きで、11種類のエンティティに対するSchema.org JSON-LD
  • 動的なタイトルタグ、注目スニペット用ブロック、OGメタ
  • 薄いコンテンツの検出とnoindex化(薄いコンテンツが43%から0%へ)
  • コンテンツの充実化により、ページを約50語から平均約190語へ
  • HTTP/2、遅延読み込みの検索インデックス、LCP最適化

アウトリーチ自動化 — VPS上で動く完成した仕組み:

  • ゲスト投稿ブログの自動発見
  • パーソナライズされた売り込み文(ピッチ)によるメールアウトリーチ
  • Telegram通知付きのバックリンク監視
  • cronで全てを実行し、手作業による介入はゼロ

データ:実数

指標
総タイトル数 13,426
インデックス済みページ数 11,766
アラビア語のあらすじあり 98%
制作データのカバレッジ 99.8%
Wikipediaの事実 1,400+
ユニークなFAQエントリ 64,813
Vitestテスト数 129
生成された静的ページ数 約7,000
ビルド時間 約13秒

AIペアプログラミングからの学び

うまくいったこと:

  • Claudeは定型文の生成、テストスイート、データ処理スクリプトの作成が非常に得意
  • SEO監査のためにClaudeエージェントを並列で複数動かす(5〜6を同時に)は、信じられないほど生産性が高かった
  • Claudeは、VideoObjectスキーマからuploadDateが抜けていることや、FAQ回答が88.7%重複になっていることなど、私が見落としていた問題を見つけてくれた

人間の判断が必要だったこと:

  • noindexにするべきか、残すべきかの判断(コンテンツの品質は主観的)
  • アウトリーチメールが自然に聞こえるかの評価
  • どのデータを信頼するかの選定(TMDBにはアラビア語コンテンツのギャップがある)
  • 戦略的な意思決定:どのプラットフォームを狙うか、どのコンテンツが実際に価値を増やすか

Claudeが間違えたこと:

  • 最初に生成した概要説明が、テンプレっぽすぎた
  • 一部のSEO推奨が、AdSenseのコンプライアンスと矛盾していた
  • 自動化された提供者(プロバイダ)更新で、MENAデータがゼロだった(TMDB/JustWatchはアラビア語の配信をカバーしていない)
  • いくつかのエージェントが、スパムのような仕組みを作ろうとしてきたため、私は却下する必要があった

最も大変だった部分:プラットフォームデータ

最大の未解決問題は次の通りです:タイトルの80%に、配信プラットフォームのデータがありません。TMDBとJustWatchは、MENA地域におけるアラビア語コンテンツのカバレッジがほぼゼロです。そもそもデータが、どのAPIにも存在しないのです。実際のプラットフォームカバレッジを得るには、個別のプラットフォームのカタログをスクレイピングする必要があります — Shahid、WatchIT、OSN+など。それ自体が別のエンジニアリング課題になります。

SEOの結果(率直な評価)

SEOを全面的に見直した後:

  • Googleの自然検索トラフィック:まだ低い(1日あたり約10)— サイトが新しいため
  • テクニカルSEO:優秀(すべてのスキーマが有効で、GSCにエラーなし)
  • コンテンツ品質:大幅に改善したが、依然として200語未満のページが58%
  • 本当の試金石は、Googleが次の2〜3か月かけて再クロールしてきた後に訪れる

やってみて

コードベース全体はClaudeで約4週間で作りました。サイドプロジェクトでAIのペアプログラミングを検討しているなら、私の助言:データが多く、SEOに重点を置いた静的サイトでは、驚くほどうまく機能します。品質や戦略的な判断のために、人間の判断を常に関与させておくことだけ忘れないでください。

Alex Nitrovicはshoofaflam.tvを構築しています。最大規模のアラビア語配信ガイドです。このプロジェクトは、AIのペアプログラミングパートナーとしてClaude(Anthropic)だけで完全に作られました。

広告