見えないところに隠れている:現場の可視化からの視覚から記号的な解析解推論
arXiv cs.AI / 2026/4/13
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、視覚化(および一次導関数)と最小限のメタデータから、2Dの線形定常物理場について単一の実行可能なSymPy式を復元することを目的とした、視覚から記号的な解析解推論(ViSA)を提案する。
- 解ファミリー(ansatz)構造を仮説として立て、パラメータを導出し、物理学者のようなワークフローで整合性を検証する自己検証型・解中心の推論パイプラインであるViSA-R2を導入する。
- 著者らは、VLM向けに準備された合成ベンチマークであるViSA-Benchを公開しており、線形定常シナリオ30件と検証可能な記号的/解析的注釈を含む。
- 評価では、数値精度、式構造の類似度、文字レベル精度といった複数の指標を用い、標準化されたプロトコルのもとで、ViSA-R2(8BのオープンウェイトQwen3-VLバックボーン)が強力なオープンソースのベースラインや複数のクローズドソースのフロンティアVLMを上回ることを示す。

