FlowExtract:メンテナンスフローチャートからの手続き的知識抽出

arXiv cs.CV / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • FlowExtractは、静的PDFやスキャン画像に固定されていることが多い、ISO 5807規格のメンテナンス用フローチャートから有向グラフの手続き的知識を抽出するパイプラインである。
  • このアプローチでは、タスクをノード検出とテキスト抽出(ドメインに整合した要素のためにYOLOv8 + EasyOCR)に分解し、その上で接続性/エッジ復元の段階を別途行う。
  • エッジ抽出では、FlowExtractは矢じりの向きに基づく新しい手法を用い、接続する線をソースノードへと逆方向にトレースすることで、図のトポロジーを復元する。
  • 工業用のトラブルシューティングガイドに対する実験では、ノード検出の性能が非常に高いことが示され、また、視覚と言語モデルのベースラインと比べてエッジ抽出が大幅に改善された。
  • 著者らはオープンソース実装(GitHub)を提供しており、FlowExtractはメンテナンス図を、オペレーター支援システムが照会できる表現へ変換する実用的な手段として位置づけられている。

Abstract

製造施設における保全手順は、しばしば静的なPDFやスキャン画像としてフローチャートに記録されています。これらは資産ライフサイクル管理に不可欠な手続き上の知識を符号化していますが、現代のオペレーター支援システムからは利用できません。画像理解における支配的なパラダイムであるビジョン・ランゲージモデルは、こうした図から接続トポロジーを復元することが困難です。本稿では、ISO 5807標準に準拠したフローチャートから有向グラフを抽出するためのパイプラインであるFlowExtractを提示します。本システムは、要素の検出と接続の復元を分離し、YOLOv8とEasyOCRを用いて標準的な領域に整合したノード検出とテキスト抽出を行うとともに、矢印先端の向きを解析し、接続している線を逆方向にたどってソースノードまで辿る、新しいエッジ検出手法を組み合わせます。産業用のトラブルシューティングガイドで評価した結果、FlowExtractは非常に高いノード検出を達成し、エッジ抽出においてビジョン・ランゲージモデルのベースラインを大幅に上回りました。これにより、組織が問い合わせ可能な手続き上の知識表現へと実用的に移行するための道筋が提供されます。本実装は https://github.com/guille-gil/FlowExtract で利用可能です。