リコーのマルチモーダルAI、図面から寸法を読み出し普通公差を適用

日経XTECH / 4/15/2026

📰 NewsSignals & Early TrendsIndustry & Market MovesModels & Research

Key Points

  • リコーは複雑に重なった図面から寸法や普通公差を読み出せるマルチモーダルLLM「Qwen3-VL-Ricoh-32B-20260227」を開発し、解釈例を示した。
  • 「大径穴の直径と公差を示せ」といった指示に対し、図面内にある普通公差表を参照して的確に回答でき、普通公差表が別ページでも同様に扱えることを明らかにした。
  • モデルは表・グラフ・チャート等を直接扱うマルチモーダル性と、多段推論(リーズニング)を備え、複数ページにまたがる図表の関連付け理解が可能としている。
  • ベンチマークではGemini 2.5-Proなどの大型商用モデルと同等の性能を示したとされ、AIプラットフォームやハードウェアに組み込む提供を見込む。
  • 軽量版「Qwen3-VL-Ricoh-8B-20260227」を2026年3月30日から無償公開し、GENIAC第3期(経産省・NEDO)に参画して開発した。

 図形が複雑に重なっている図面の正確な解釈は、人間でも慣れないと難しい。この図面や図表などから情報を的確に読み取るAI(人工知能)の開発をリコーが進めている。同社は、このほど開発したマルチモーダルAIの大規模言語(LLM)モデル「Qwen3-VL-Ricoh-32B-20260227」(以下、リコーLLM-32B)の適用例として、図形が複雑に重なる図面の解釈例を示した。

 用紙の右上に普通公差(一般公差、個別に指示がない場合に適用する公差)の表の記載がある図面について「中央にある大径穴の直径と公差を示せ」との指示に対し、開発モデルが的確に回答した。リコーは「公差表が図面の別のページに記載されていた場合でも、同様の回答ができる」と明らかにした。

 同モデルは、表やグラフ、チャート類などを直接扱うマルチモーダル性と、多段推論(リーズニング)機能を持つように開発したもの。複数ページにまたがる図表を関連付けて理解できる。ベンチマークでは「Google Gemini 2.5-Pro」などの大型商用モデルと同等の性能を示したとしている。

開発したモデル(リコーLLM-32Bと表記)のベンチマーク結果(出所:リコー)
開発したモデル(リコーLLM-32Bと表記)のベンチマーク結果(出所:リコー)
[画像のクリックで拡大表示]

 開発モデルはAIプラットフォームやハードウエアに組み込んだシステムとして提供する見込み。開発モデルを軽量化したモデル「Qwen3-VL-Ricoh-8B-20260227」は2026年3月30日から無償公開を始めた。経済産業省と新エネルギー・産業技術総合開発機構(NEDO)による生成AI開発力強化のプロジェクト「GENIAC(Generative AI Accelerator Challenge)」第3期に参画して開発した。

次のページ

「日本の文書は複雑な図表を含む」

この記事は有料会員限定です