広告

OmniSch:構造化された図形の視覚推論のためのマルチモーダルPCB回路図ベンチマーク

arXiv cs.CV / 2026/4/2

📰 ニュースSignals & Early TrendsModels & Research

要点

  • OmniSchは、PCB回路図を解釈し、それらを機械可読な空間的重み付きネットリストグラフへ変換するLMMの能力を評価するための、新しいマルチモーダルベンチマークとして導入される。
  • このデータセットは1,854件の実世界のPCB回路図を対象としており、4つのタスクをサポートする:視覚的グラウンディング、図からグラフへのトポロジー推論、レイアウト依存の接続重みに関する幾何学的推論、ツールを併用したエージェント的推論。
  • 109.9K件のグラウンディング済みインスタンスを含む、豊富な教師信号を提供し、423.4K件のセマンティックラベルを視覚領域に対応付けることで、きめ細かな理解を目指す。
  • 初期結果は、現在のLMMにおける重大な弱点を示しており、たとえば信頼性の低いきめ細かなグラウンディング、脆いレイアウトからグラフへのパース、整合性のない大域的な接続性推論、非効率な視覚探索挙動などが挙げられる。

要旨: 最近の大規模マルチモーダルモデル(LMMs)は、視覚的グラウンディング、文書理解、図表推論のタスクにおいて急速な進歩を遂げてきました。しかし、プリント基板(PCB)の回路図(スキーマティック)図から、部品属性、結線、幾何(ジオメトリ)を共同で捉えながら、機械可読な空間的に重み付けられたネットリスト・グラフへ変換する能力は、そのようなグラフ表現が実用的な電子設計自動化(EDA)ワークフローの基盤であるにもかかわらず、ほとんど未開拓のままです。このギャップを埋めるために、私たちは、回路図理解と空間ネットリスト・グラフ構築におけるLMMsを評価することを目的とした最初の包括的ベンチマークであるOmniSchを導入します。OmniSchには、1,854枚の実世界の回路図が含まれており、4つのタスクがあります。(1)回路図上の対象のための視覚的グラウンディングで、109.9K件のグラウンディングされた実例が、図のセマンティック・ラベル423.4K件をそれらの視覚領域に対応付けます。(2)図からグラフへの推論で、図中の要素間の位相(トポロジー)関係を理解します。(3)幾何(ジオメトリ)推論で、各結線に対するレイアウト依存の重みを構築します。(4)(1)〜(3)を達成するために外部ツールを呼び出す、ツール拡張型のエージェント的推論による視覚探索です。私たちの結果は、現在のLMMが回路図工学アーティファクトを解釈するうえで、信頼性の低いきめ細かなグラウンディング、脆弱なレイアウトからグラフへのパース、不整合な大域的な結線(コネクティビティ)推論、非効率な視覚探索など、重大なギャップを示すことを明らかにしました。

広告
OmniSch:構造化された図形の視覚推論のためのマルチモーダルPCB回路図ベンチマーク | AI Navigate