AnimateAnyMesh++:高精度なテキスト駆動メッシュアニメーションのための柔軟な4D基盤モデル

arXiv cs.CV / 2026/4/30

📰 ニュースSignals & Early TrendsModels & Research

要点

  • 本論文では、4D学習データの不足や時空間分布の複雑さといった課題の中でも、任意の3Dメッシュに対してテキストから高精度なメッシュアニメーションを生成する「AnimateAnyMesh++」が提案されます。
  • DyMesh-XLのデータセットをObjaverse-XLから動的コンテンツをマイニングして拡張し、ユニークなアイデンティティ数を60Kから300Kへ増やして、カテゴリとモーションの多様性を大きく高めています。
  • DyMeshVAE-Flexを、パワー則のトポロジーに着目した注意機構と頂点法線強化特徴で改良し、軌道復元の精度向上、局所的な形状保持、そして「軌道がくっつく」アーティファクトの抑制を実現します。
  • DyMeshVAE-Flexとrectified-flow(RF)ジェネレータの両方を変更し、可変長シーケンスの学習・生成に対応させることで、より長いアニメーションを作れても再構成品質を維持できるようにしています。
  • 実験では、本手法が数秒で意味的に正しく時間的一貫性のあるメッシュアニメーションを生成し、従来手法より質と効率の両面で優れること、さらにコードとモデルおよび拡張DyMesh-XLを受理後に公開する予定であることが示されています。