Microsoft ResearchのWorld-R1はFlow-GRPOと3D対応リワードで、建築変更なしにWan 2.1へ幾何学的整合性を注入

MarkTechPost / 2026/5/1

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • Microsoft ResearchのWorld-R1は、強化学習を用いてテキストから生成する動画の幾何学的(3D)整合性を高める。
  • この手法はFlow-GRPOと3D対応の報酬シグナルを使い、生成フレーム間で安定した3D構造を促す。
  • 基盤となるテキスト・トゥ・ビデオモデルのアーキテクチャを変更せずに、Wan 2.1へ3D整合性の改善を適用できるとしている。
  • 生成動画モデルにありがちな課題である、時間とともに幾何学的な妥当性が崩れる「一貫性の欠如」を狙い打つ。

Microsoft ResearchのWorld-R1は強化学習を用いて、テキストからビデオへのモデルに3Dの一貫性を強制する

この記事はMarkTechPostに最初に掲載された、Microsoft Research’s World-R1 Uses Flow-GRPO and 3D-Aware Rewards to Inject Geometric Consistency Into Wan 2.1 Without Architectural Changesです。