相界面インスタンスセグメンテーションを用いたラボラトリープロセス監視の視覚センサー
arXiv cs.CV / 2026/3/12
📰 ニュースTools & Practical UsageModels & Research
要点
- 相界面インスタンスセグメンテーションを透明ガラス器具内の化学実験を監視する視覚センサーとして提示します。
- CTG 2.0データセットを3,668枚の画像、23のガラス器具カテゴリ、5つの多相界面タイプを備えたベンチマークとして導入します。
- Local-Global Attentionと矩形自己校正モジュールを組み合わせたLGA-RCM-YOLOを提案し、境界を洗練させることで84.4% AP@0.5、58.43% AP@0.5-0.95を達成し、YOLO11mベースラインをそれぞれ6.42ポイント、8.75 APポイント上回ります。
- RTX 3060上でのほぼリアルタイム推論(13.67 FPS)と、補助的なカラー属性ヘッドが98.71%の精度と98.32%の再現率を達成し、分液漏斗の相分離と結晶化の継続的なプロセス監視を可能にし、ラボ自動化の実用的な視覚センサーとして機能します。
本文: arXiv:2603.10782v1 発表タイプ: 新規
要旨: 化学実験の視覚的モニタリングは、透明なガラス器具内で依然として困難であり、弱い相境界と光学的アーティファクトが従来のセグメンテーションを劣化させます。我々は実験室現象を相界面の時間発展として定式化し、Chemical Transparent Glassesデータセット2.0(CTG 2.0)を導入します。CTG 2.0は、3,668枚の画像、23のガラス器具カテゴリ、5つの多相界面タイプを備えた器具認識ベンチマークで、相界面インスタンスセグメンテーションを目的としています。YOLO11m-segを基に、局所-グローバルアテンション(LGA)による堅牢な意味表現と、薄く長く伸びた界面の境界を精練する矩形自己校正モジュール(RCM)を組み合わせたLGA-RCM-YOLOを提案します。CTG 2.0上で、提案モデルは84.4% AP@0.5および58.43% AP@0.5-0.95を達成し、YOLO11mベースラインよりそれぞれ6.42ポイント、8.75ポイントのAP改善を示し、ほぼリアルタイム推論(13.67 FPS、RTX 3060)を維持します。補助的なカラー属性ヘッドは、液体インスタンスを着色または無着色としてさらにラベリングし、精度98.71%、再現率98.32%を達成します。最後に、分液漏斗による相分離と結晶化における継続的なプロセスモニタリングを実証し、相界面インスタンスセグメンテーションが実験室自動化の実用的な視覚センサーとして機能することを示します。
