Microsoft ResearchのWorld-R1は強化学習を用いて、テキストからビデオへのモデルに3Dの一貫性を強制する
この記事はMarkTechPostに最初に掲載された、Microsoft Research’s World-R1 Uses Flow-GRPO and 3D-Aware Rewards to Inject Geometric Consistency Into Wan 2.1 Without Architectural Changesです。
MarkTechPost / 2026/5/1
Microsoft ResearchのWorld-R1は強化学習を用いて、テキストからビデオへのモデルに3Dの一貫性を強制する
この記事はMarkTechPostに最初に掲載された、Microsoft Research’s World-R1 Uses Flow-GRPO and 3D-Aware Rewards to Inject Geometric Consistency Into Wan 2.1 Without Architectural Changesです。