拡散ノイズにおける物理の探索
arXiv cs.RO / 2026/3/27
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、事前学習済みの動画拡散モデルが、中間のノイズ除去表現に物理的妥当性と相関するような信号を含んでいるかどうかを検討する。
- その結果、物理的に妥当な動画とそうでない動画は、複数のノイズレベルにわたって中間層の特徴空間上で部分的に分離可能であることが分かる。この分離は、視覚的な品質や生成器の同一性だけでは十分に説明できない。
- 以上の知見に基づき、著者らは「逐次的軌道選択(progressive trajectory selection)」を提案する。これは、推論時に数個の中間チェックポイントで複数のノイズ除去軌道をスコアリングし、軽量な物理検証器(physics verifier)を用いて選別する手法である。
- 検証器は拡散トランスフォーマの凍結済み特徴を用いて学習されるため、計算量を削減する目的でスコアの低い軌道を早期に枝刈りできる。
- PhyGenBench に対する実験では、物理的整合性の向上と推論コストの削減が確認され、より少ないノイズ除去ステップ数で Best-of-K サンプリングと同等の結果が得られる。
広告
