振動に迷う:ビジョン・ランゲージ・モデルはダイナミック・ゲージ・テストに失敗
arXiv cs.CV / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、GPT-5やGemini 3を含むビジョン・ランゲージ・モデルが、針の動きに高周波の時間的事象や振動が含まれる場合に、アナログ計器の計測としての解析をメトロロジー水準で行うのが難しいことを示しています。
- 研究では、不確かさの定量化などの計測要件と、安全性が重要なモニタリングで必要となるトレーサビリティおよび信頼性の観点から、モデルを評価しています。
- 厳密な検証を可能にするために、著者らは、新しいベンチマーク用データセットとして、円形・直線・ベルニエの各種ゲージを、複数の速度プロファイルで動かした動画を収録したものを提示しています。
- 結果として、針の軌跡の解釈や目盛りの意味理解に失敗しており、既存のIEEEおよびISO標準の下で「信頼できる合成計器」と分類できる性能にはまだ達していないと結論づけています。




