図面を読めるAIに、仕事を任せてみた
こんにちは。
町工場でひとり事業部を運営している40代のおじさんです。
製造業にいる人なら、図面を見ない日はないと思います。
自分も毎日図面を見ています。
取引先から届いた図面を開いて、寸法を確認して、加工方法を考えて、見積もりを出す。
この作業の中で、地味に時間がかかっていたのが
「図面から寸法を読み取る」という工程でした。
で、ある日ふと思ったんです。
「これ、AIに読ませたらどうなるんだろう」と。
図面の寸法を読み取る、という作業
製造業以外の人にはピンとこないかもしれないので、簡単に説明します。
取引先から「この部品を作ってください」と依頼が来ます。
一緒に届くのが図面(PDF)です。
図面には、部品の形や寸法が書いてあります。
「縦100mm、横50mm、穴径10mm」みたいな情報です。
見積もりを出すには、この寸法を全部読み取って、材料費や加工費を計算する必要がある。
これを今まで、目で見て、手でメモして、Excelに打ち込んでいました。
1枚の図面なら数分で終わります。
でも、複数ページの図面や、細かい寸法がたくさんある図面だと、読み取りだけで30分かかることもある。
しかも、見落としや読み間違いのリスクが常にある。
最初はOCRを試した。ダメだった
実は最初、AIではなくOCRで図面を読もうとしました。
OCRは「画像の中の文字を読み取る技術」です。
コピー機のスキャンに近い感覚で、「文字の形を認識して、テキストデータに変換する」もの。スマホアプリにも入っています。
結果、ダメでした。
なぜか。
図面って、ただ文字が並んでいるわけじゃないんです。
寸法線があって、矢印があって、注記が端っこに書いてあって、表が埋め込まれていて。
OCRは文字を拾えるけど、「この数字がどこの寸法なのか」がわからない。
たとえば「50」という数字を拾っても、それが幅なのか高さなのか厚みなのか、OCRには判断できません。
たとえるなら、OCRは「文字を一文字ずつ書き写す係」です。
書いてあることの意味はわかっていない。
AIのVisionは「意味を理解する」
ここで登場するのが、AIの「Vision」という機能です。
画像やPDFを見て、中身を理解してくれる。
OCRとの違いを一言で言うと、こうです。
OCRは「文字を読む」。
Visionは「文字を読んだ上で、内容を理解する」。
たとえるなら、OCRがコピー機なら、Visionはベテラン社員の目です。
手書きの買い物メモを見せたとします。
OCRは「たまご、ぎゅうにゅう、ぱん」とテキストに変換する。
Visionは「朝ごはんの材料の買い物リストですね」と理解する。
この差です。
図面でいえば、Visionは「この図面は板金部品で、材質はSUS304、板厚は1.6mm、外形寸法は……」と、図面を"見て"意味を理解して返してくれる。
正直、初めてこれを見たとき、ちょっと震えました。
AIに図面を読ませてみた
このVisionを使って、図面のPDFをAIに渡してみました。
「この図面の寸法を全部読み取って、リストにして」
結果は、想像以上でした。
主要な寸法をほぼ正確に読み取ってくれた。
しかも、リスト形式で整理して出してくれる。
目で読んで手で打ち込んで30分かかっていた作業が、数十秒で終わりました。
完璧ではない。でも十分使える
正直に言うと、AIの読み取りは完璧ではありません。
間違えるケースもあります。小さい文字や潰れた文字を誤読する。
公差(±0.05みたいな数値)を見落とすことがある。
複雑な図面で寸法線を取り違えることがある。
だから、AIが出した結果をそのまま使うことはしません。
AIが読み取った寸法を、自分の目で確認する。
おかしいところがあれば修正する。
でも、考えてみてください。
「ゼロから全部読み取る」のと「AIが出した結果を確認する」のでは、作業量がまったく違います。
ゼロから読むのが30分なら、確認するのは5分で済みます。
見積もりの流れが変わった
図面の読み取りをAIに任せたことで、見積もりの流れ全体が変わりました。
以前:メールを開く → 図面PDFを開く → 目で寸法を読む → 手でメモする → Excelに打ち込む → 計算する → 返信メールを書く
今:AIがメールを検知 → 図面PDFをAIが読み取り → 寸法をテンプレートに自動入力 → 自分は材料費と加工費を判断 → 返信メールを確認して送信
手作業が5工程から1工程に減りました。
残った1工程は「材料費と加工費の判断」です。
これはAIにはできない。(任せられない)
現場の経験がないと判断できない部分です。
AIが読み取りと入力を引き受けてくれたおかげで、自分は「判断」に集中できるようになった。
OCRとVision、結局どっちを使えばいい?
ざっくりした目安はこうです。
「文字だけ拾えればいい」ならOCR。
きれいに印刷された請求書やレシートの処理には向いています。
大量の定型帳票を高速で処理したいときも、OCRのほうが安くて速い。
「内容を理解させたい」ならVision。
表や図が混在した資料、図面やカタログのように、レイアウトの位置関係が意味を持つ書類にはVisionが強い。
ただし、Visionは処理にコストがかかります。
APIを通して画像を送るので、1回ごとに少額ですがお金がかかる。
万能ではありません。
でも、今まで「人間がやるしかなかった判断」を肩代わりしてくれる。
そこがVisionのすごいところです。
「図面を読める人」の価値は変わるのか
ここで気になることがあります。
「AIが図面を読めるなら、図面を読める人の価値は下がるんじゃないか?」
自分の答えはノーです。
AIは寸法の数字を読み取ることはできます。
でも、図面を見て「この形状は加工が難しい」「この公差は厳しい」と判断することはできません。
図面を「読む」と図面を「理解する」は、まったく別のスキルです。
数字を拾うのはAIに任せる。
その数字の意味を判断するのは、人間の仕事。
AIは図面の「目」にはなれるけど、「頭」にはなれない。
この記事で言いたかったこと
図面からの寸法読み取りは、地味に時間がかかる作業だった
OCRでは「文字は拾えるが意味がわからない」という壁にぶつかった
AIのVision機能で、図面を"理解"して寸法を読み取れるようになった
完璧ではないが、30分が5分になった
見積もりの手作業が5工程から1工程に減った
AIは図面の「目」にはなれるが「頭」にはなれない
製造業の現場で働く40代のおじさんは、AIに図面を読ませています。完璧ではありません。でも、30分が5分になりました。もちろん、AIの読み取り精度はまだ発展途上です。でも「確認するだけでいい」という状態は、十分に実用的です。
この記事は「ひとり事業部のAI奮闘記」シリーズの一つです。町工場のひとり事業部が、AIを使って業務を変えていく日々を発信しています。
#AI #ChatGPT #Claude #生成AI #AI初心者 #AI活用 #製造業 #中小企業 #ひとり事業部 #町工場 #DX #40代の挑戦 #note初心者 #図面 #Vision #OCR #見積自動化





