BlenderRAG:検索拡張コード合成による高精度3Dオブジェクト生成

arXiv cs.AI / 2026/5/4

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • BlenderRAGは、自然言語から実行可能なBlenderコードを生成する難しさに対処し、従来の最先端LLMが頻発しがちな文法エラーや3D形状の一貫性欠如を改善しようとしています。
  • このシステムは、50のオブジェクトカテゴリにまたがるテキスト・コード・画像の500件の専門家検証済みマルチモーダル事例を用いた、検索拡張(retrieval-augmented)によるコード合成を採用しています。
  • 生成中に意味的に近い事例を検索して参照することで、Blenderコードのコンパイル成功率を40.8%から70.0%へ、さらに意味的整合(CLIP類似度)を0.41から0.77へ、4つの最先端LLMすべてで向上させます。
  • 微調整(ファインチューニング)や特殊なハードウェアを必要としないため、高精度3Dオブジェクト生成の導入性を高めることを狙っています。
  • 著者らは、提示されたGitHubリポジトリを通じてデータセットとコードを公開予定です。

Abstract

自然言語から実行可能なBlenderコードを自動生成することは依然として困難であり、最先端のLLMは頻繁に構文エラーを起こし、幾何学的に整合しないオブジェクトを生成します。私たちはBlenderRAGを提案します。BlenderRAGは、50のオブジェクトカテゴリにまたがる500件の専門家による検証済みのマルチモーダルデータセット(テキスト、コード、画像)に基づいて動作する、検索拡張生成(retrieval-augmented generation)システムです。生成中に意味的に類似した例を取得することで、BlenderRAGは4つの最先端LLMにおいて、コンパイル成功率を40.8%から70.0%へ、セマンティック正規化アラインメントを0.41から0.77(CLIP類似度)へと改善します。さらに、微調整や専用ハードウェアを必要とせず、デプロイのために直ちに利用可能です。データセットとコードは https://github.com/MaxRondelli/BlenderRAG で公開されます。