GenAssets:潜在空間で「その場の実環境」から3Dアセットを生成する

arXiv cs.CV / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • GenAssetsは、実環境のLiDARとカメラデータから交通参加者向けの高品質な3Dアセットを生成する3D潜在拡散手法を提案し、自動運転向けマルチセンサシミュレーションの現実感と多様性の向上を目指している。
  • 既存のニューラルレンダリングによる復元は遅く、元の観測に近い視点でしかうまくレンダリングできないことが多い一方、拡散ベース手法は疎で限られた視野かつ遮蔽のある実走行シーンで性能が落ちると論じている。
  • 本手法の中核は「reconstruct-then-generate(復元してから生成)」であり、複数シーンで学習した遮蔽に配慮したニューラルレンダリングで高品質な潜在空間を作り、その潜在空間上で拡散モデルを学習・生成する。
  • 著者らは、既存の復元・生成手法に対して提案手法が優れていることを示し、シミュレーション用コンテンツ作成をより多様かつスケーラブルにできると主張している。
  • 本研究は、完全な幾何形状と外観を持つ模擬アクターを生成することで、自動運転システムのエンドツーエンド開発をより安全に進めるための基盤技術として位置付けられている。

概要: 交通参加者のための高品質な3Dアセットは、安心・安全な自律のエンドツーエンド開発に不可欠なマルチセンサーシミュレーションにおいて重要です。現実世界(in-the-wild)データからアセットを構築することは、多様性と現実感のための鍵ですが、既存のニューラルレンダリングに基づく再構成手法は遅く、元の観測に近い視点でのみうまくレンダリングできるアセットを生成するため、シミュレーションでの有用性が制限されます。近年、拡散ベースの生成モデルは完全で多様なアセットを構築できますが、観測されたアクターが疎で限定的な視野のもとで捉えられ、さらに一部が遮蔽されているような、in-the-wildの走行シーンでは性能が低下します。本研究では、センサープラットフォームによって取得されたin-the-wildのLiDARおよびカメラデータから学習する3D潜在拡散モデルを提案し、完全なジオメトリと外観を備えた高品質な3Dアセットを生成します。提案手法の要となるのは、「再構成してから生成する(reconstruct-then-generate)」アプローチであり、まず複数のシーンにわたって学習した遮蔽に配慮したニューラルレンダリングを活用してオブジェクトの高品質な潜在空間を構築し、次にその潜在空間上で動作する拡散モデルを学習します。本手法は、既存の再構成および生成に基づく手法よりも優れた性能を示し、シミュレーションのための多様でスケーラブルなコンテンツ制作を可能にします。