リコーのマルチモーダルAI、図面から寸法を読み出し普通公差を適用

日経XTECH / 4/15/2026

📰 NewsSignals & Early TrendsIndustry & Market MovesModels & Research

共有:

Key Points

リコーは複雑に重なった図面から寸法や普通公差を読み出せるマルチモーダルLLM「Qwen3-VL-Ricoh-32B-20260227」を開発し、解釈例を示した。
「大径穴の直径と公差を示せ」といった指示に対し、図面内にある普通公差表を参照して的確に回答でき、普通公差表が別ページでも同様に扱えることを明らかにした。
モデルは表・グラフ・チャート等を直接扱うマルチモーダル性と、多段推論（リーズニング）を備え、複数ページにまたがる図表の関連付け理解が可能としている。
ベンチマークではGemini 2.5-Proなどの大型商用モデルと同等の性能を示したとされ、AIプラットフォームやハードウェアに組み込む提供を見込む。
軽量版「Qwen3-VL-Ricoh-8B-20260227」を2026年3月30日から無償公開し、GENIAC第3期（経産省・NEDO）に参画して開発した。

　図形が複雑に重なっている図面の正確な解釈は、人間でも慣れないと難しい。この図面や図表などから情報を的確に読み取るAI（人工知能）の開発をリコーが進めている。同社は、このほど開発したマルチモーダルAIの大規模言語（LLM）モデル「Qwen3-VL-Ricoh-32B-20260227」（以下、リコーLLM-32B）の適用例として、図形が複雑に重なる図面の解釈例を示した。

　用紙の右上に普通公差（一般公差、個別に指示がない場合に適用する公差）の表の記載がある図面について「中央にある大径穴の直径と公差を示せ」との指示に対し、開発モデルが的確に回答した。リコーは「公差表が図面の別のページに記載されていた場合でも、同様の回答ができる」と明らかにした。

　同モデルは、表やグラフ、チャート類などを直接扱うマルチモーダル性と、多段推論（リーズニング）機能を持つように開発したもの。複数ページにまたがる図表を関連付けて理解できる。ベンチマークでは「Google Gemini 2.5-Pro」などの大型商用モデルと同等の性能を示したとしている。

開発したモデル（リコーLLM-32Bと表記）のベンチマーク結果（出所：リコー）

[画像のクリックで拡大表示]

　開発モデルはAIプラットフォームやハードウエアに組み込んだシステムとして提供する見込み。開発モデルを軽量化したモデル「Qwen3-VL-Ricoh-8B-20260227」は2026年3月30日から無償公開を始めた。経済産業省と新エネルギー・産業技術総合開発機構（NEDO）による生成AI開発力強化のプロジェクト「GENIAC（Generative AI Accelerator Challenge）」第3期に参画して開発した。

「日本の文書は複雑な図表を含む」

この記事は有料会員限定です