ゾーン・グラフ・パラダイムによる空間セマンティクスのオーケストレーション:複雑な屋内シーン生成のために

arXiv cs.RO / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • この論文は、複雑な形状の非凸な部屋や、空間制約が密に結びついた状況での破綻を解決する自律的な3D屋内シーン生成のためのフレームワーク「ZoneMaestro」を提案しています。
  • オブジェクト中心の合成ではなく、Zone-Graphオーケストレーションにより、高レベルのセマンティック意図を機能ゾーンと明示的なトポロジカル制約へと変換します。
  • 著者らは、ゾーン・グラフ注釈を含む大規模データセット「Zone-Scene-10K」を公開し、内部推論の内在化と、ゾーン対応のグループ相対ポリシー最適化(Z-GRPO)を交互に行う「Alternating Alignment Strategy」を提示しています。
  • さらに、不規則な屋内シーンで複雑かつ密な空間関係を扱うためのストレステストとして、「Intricate Spatial Orchestration」タスクとベンチマーク「SCALE」を定義し公開しています。
  • 実験では、ZoneMaestroが構造的一貫性と意図追従の両面で改善し、密度と安全性のトレードオフを解消しつつ、既存の最先端ベースラインを大きく上回ることが示されています。

Abstract

自律的な3D屋内シーン生成は、空間制約が密に結び付いた非凸な部屋では破綻します。データ駆動型のジェネレータは、長期ホライズン計画のための位相(トポロジー)の事前知識を欠いています。一方で、反復エージェントは意味論を断片化し、幾何学的に脆くなります。私たちは、物体中心の生成からゾーン・グラフ・オーケストレーションへとパラダイムを転換する統一フレームワークであるZoneMaestroを提案します。新しいゾーンベースの論理を内部化することで、ZoneMaestroは高レベルの意味意図を機能ゾーンと位相(トポロジー)制約へと翻訳し、多様な建築形状への頑健な適応を可能にします。これを支えるために、明示的なゾーン・グラフ注釈を付与した大規模データセットZone-Scene-10Kを構築します。さらに、推論の内部化と、ゾーンを考慮したグループ相対ポリシー最適化(Z-GRPO)の間を交互に切り替える交互アラインメント戦略を導入します。これにより、外部の物理エンジンに依存することなく、意味の豊かさと幾何学的妥当性の間にある緊張関係を効果的に調停します。凸状プリミティブを超えた空間知能を厳密に評価するために、複雑な空間オーケストレーションの課題を形式的に定義し、複雑で密な空間関係を伴う不規則な屋内シナリオ向けのストレステスト・ベンチマークであるSCALEを公開します。大規模な実験により、ZoneMaestroが密度と安全性の二律背反を解消し、構造的一貫性と意図への適合の両面で、最先端のベースラインを大幅に上回ることを示します。