LLMベースの適応的探索によるBIM情報抽出

arXiv cs.CL / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、BIMモデルから特定の情報を抽出することが難しい主因として、既存の自然言語から構造化クエリへの手法が固定されたデータ構造を前提にしており、BIMの多様性により破綻し得る点を指摘しています。
  • 「適応的探索(adaptive exploration)」として、LLMベースのエージェントがコードを反復実行し、実行時にBIMモデルの構造を探索して前提スキーマに依存しない手法を提案しています。
  • 提案手法は、ifc-bench v2で評価されており、これは本研究と同時に導入されたオープンソースのBIM質問応答ベンチマークで、21プロジェクト由来の37のIFCモデルに対して1,027タスクを含みます。
  • 2つのLLM能力レベルと4つの拡張戦略にわたる因子アブレーションの結果、適応的探索は静的なクエリ生成よりもあらゆる構成で一貫して優れていることが示されています。
  • これらの結果は、BIMの多様性への対処は、静的手法のさらなる最適化よりも、相互的な探索というパラダイムレベルで取り組むのが有効であることを示唆しています。

要旨: BIMモデルは、建築の幾何、意味論、位相を構造化して表現しますが、そこから特定の情報を抽出することは依然として驚くほど困難です。現在のアプローチは、固定されたデータの整理(静的アプローチ)を前提にして、自然言語を構造化されたクエリへと変換します。しかし、BIMの異種性は最終的にこの前提を無効にします。私たちは、まったく新しいパラダイムとして適応的探索を提案します。これは、LLMベースのエージェントが反復的にコードを実行してBIMモデルから情報を抽出し、前もって想定するのではなく実行時にその構造を発見するものです。このアプローチを、本研究とともに導入されたオープンソースのBIM質問応答ベンチマークであるifc-bench v2で評価します。ifc-bench v2は、21のプロジェクトにまたがる37のIFCモデルから成り、1,027のタスクを含みます。2つのLLM能力レベルと4つの拡張戦略にわたる因子分解的なアブレーションにより、適応的探索は、拡張戦略にかかわらず、すべての構成において静的クエリ生成を大きく上回ることが示されます。これらの結果は、BIMの異種性は静的アプローチをさらに最適化することでではなく、パラダイムのレベルでこそ対処すべきであることを示しています。