MANSION: 複数階層の言語入力を3Dシーンへ変換する長期タスク向け生成フレームワーク

arXiv cs.CV / 2026/3/13

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、長期的なロボットタスクのための建物規模の多階層3D環境を生成する言語駆動フレームワーク「MANSION」を紹介します。
MansionWorld は、病院からオフィスまで1,000を超える多様な建物から成るデータセットと、オープン・ボキャブラリ対応のカスタマイズを可能にするタスクセマンティック・シーン編集エージェントが、フレームワークとともに公開されます。
フレームワークは垂直方向の構造制約を考慮し、階を跨ぐ計画と評価に適した現実的で探索可能な建物全体の構造を生成します。
ベンチマーク結果は、最先端エージェントがこれらの設定で急激に性能を低下させることを示しており、次世代の空間推論と計画の重要なテストベッドとして MANSION を確立しています。

要旨：現実世界のロボットタスクは長期的で、多くは複数の階にまたがり、豊かな空間推論を要求します。しかし、既存の具現化ベンチマークは主に単一階の院内環境に限定されており、現実世界のタスクの複雑さを反映していません。我々は、建物規模の多層3D環境を生成する最初の言語駆動フレームワーク「MANSION」を導入します。垂直方向の構造制約を踏まえ、MANSION は多様で人間にも優しいシーンを含む現実的で探索可能な建物全体の構造を生成し、跨階層の長期タスクの開発と評価を可能にします。このフレームワークを基礎に、1,000以上の多様な建物からなるデータセット「MansionWorld」と、オープンボキャブラリのコマンドを用いてこれらの環境を特定のユーザーニーズに合わせてカスタマイズするタスクセマンティックシーン編集エージェントをリリースします。ベンチマークは、最先端のエージェントが私たちの設定で急激に劣化することを明らかにしており、次世代の空間推論と計画の重要なテストベッドとして MANSION を確立します。

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

note

AI達の革命

note

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

note

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒

note

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

note

MANSION: 複数階層の言語入力を3Dシーンへ変換する長期タスク向け生成フレームワーク

要点

関連記事

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

生成AIが提案した減量食のプランから考える、人間の専門家の必要性

AI達の革命

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

『AIと意識』諸葛亮 孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話 その肆拾柒

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

『AIと意識』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾柒