WebGen-R1:強化学習で大規模言語モデルに機能面と美しさを備えたWebサイト生成を促す

arXiv cs.CL / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • WebGen-R1は、LLMの単一ファイルのコード生成に比べて難しいプロジェクト規模の「機能的で見た目も美しいマルチページWebサイト」生成を対象にした、エンドツーエンドの強化学習フレームワークを提案しています。
  • scaffold-driven(足場駆動)による構造化生成により、オープンエンドな行動空間を抑えつつ、サイト生成中のアーキテクチャ整合性を維持します。
  • カスケード型のマルチモーダル報酬として、構造上の制約、実行に基づく機能フィードバック、さらに視覚に基づく美的評価(監督)を組み合わせ、RL報酬設計の難所を克服します。
  • 実験では、WebGen-R1が7Bベースモデルを「ほぼ動作しないサイト」から「デプロイ可能な美しく整ったマルチページサイト」へ大きく改善できることが示され、より大規模なオープンモデルを上回りつつ、DeepSeek-R1とも主要指標で拮抗〜上回る結果が報告されています。
  • 著者らは、この手法により小型モデルを「関数レベルのコード生成」から「プロジェクトレベルのWebアプリ生成」へスケールさせる道筋が示せると主張しています。