最強のAIモデルでも複雑なチャートでは性能が約半分に低下、新しいベンチマークが判明

THE DECODER / 2026/4/19

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

RealChart2Codeベンチマークは、実世界のデータセットから作成した複雑な可視化を用いて、コード生成の質を14の主要AIモデルで検証します。
その結果、チャートが複雑になるとトップのプロプライエタリモデルでも性能がほぼ半分に落ちることが示されました。
この結果は、現在のモデルの能力がシンプルなチャートからのコード生成では比較的安定している一方、図・グラフ・可視化が多い入力では信頼性が下がりやすいことを示唆しています。
本ベンチマークは、視覚的な分析を実行可能なコードへ変換するAIシステムにおいて、難しい条件下での頑健性を高める必要性を浮き彫りにしています。

図表化をコードへ変換する複雑さを象徴するものとして、ダイアグラムのウィンドウ、配色、ケーブルをコラージュした画像。

RealChart2Codeベンチマークでは、実世界のデータセットから作られた複雑な可視化に対して、14の主要なAIモデルをテストします。トップクラスの独自モデルでさえ、より単純なテストと比べてパフォーマンスをほぼ半分失います。

日経XTECH

Reddit r/LocalLLaMA

Dev.to

Dev.to

Dev.to