AEC-Bench: A Multimodal Benchmark for Agentic Systems in Architecture, Engineering, and Construction
arXiv cs.AI / 4/1/2026
📰 NewsSignals & Early TrendsTools & Practical UsageModels & Research
Key Points
- AEC-Benchを、建築・エンジニアリング・建設(AEC)領域の実世界タスク向けに設計したマルチモーダルなベンチマークとして提案しています。
- 図面理解、複数シート間の推論、建設プロジェクト全体の調整といった「エージェント的」能力を評価するタスク群を定義しています。
- データセットの分類体系、評価プロトコル、そして複数のドメイン特化ファウンデーションモデル環境(harness)でのベースライン結果を報告しています。
- AEC-Benchの分析により、Claude CodeやCodexのようなベースハーネス内で一貫して性能を押し上げるツール設計・ハーネス設計の手法を特定したとしています。
- ベンチマークのデータセット、エージェント用ハーネス、評価コードをApache 2ライセンスで公開し、再現可能性を高めています。
Related Articles

Black Hat USA
AI Business

Black Hat Asia
AI Business

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to

Day 6: I Stopped Writing Articles and Started Hunting Bounties
Dev.to

Early Detection of Breast Cancer using SVM Classifier Technique
Dev.to