境界からセマンティクスへ:プロンプト誘導による岩石顕微鏡薄片画像のマルチタスク学習とセグメンテーション

arXiv cs.CV / 2026/4/17

📰 ニュースModels & Research

要点

  • 本論文は、粒界(grain-edge)セグメンテーション(GES)と岩相(lithology)のセマンティックセグメンテーション(LSS)を同時に扱うことで、岩石の組織構造と組成をより包括的に定量化することを目的としています。
  • Segment Anything Model(SAM)は境界整合性に強い一方で、消光(extinction)に依存する色変化や極微細な粒界によって生じるドメインギャップのため、薄片の偏光顕微鏡画像へ直接適応するのは難しいと述べられています。
  • 提案手法 Petro-SAM は、SAM を基盤にした2段階・プロンプト誘導のマルチタスク学習フレームワークであり、複数角度の画像スタック上で GES と LSS を高品質に両立することを狙います。
  • Petro-SAM は 7枚の偏光ビューを統合する Merge Block により消光由来の問題を軽減し、さらにマルチスケール特徴融合と色エントロピーの事前知識を加えて検出精度を高めます。

Abstract

粒界エッジ分割(GES)と岩相セマンティック分割(LSS)は、岩石の組織および構成を定量化するための2つの重要なタスクである。しかし、これら2つのタスクはしばしば別々に扱われており、分割品質は妥当でないにもかかわらず高価で、時間を要し、専門家による注釈付きデータセットが用いられてきた。近年、基盤モデル、特にセグメント・エニシング・モデル(SAM)は境界整合に対して驚くほどの頑健性を示している。とはいえ、SAMをGESとLSSの両方に対して直接適応することは自明ではない。理由は、1)消光(extinction)に依存した色の変動と、極めて微細な粒界によって引き起こされる大きなドメインギャップ、ならびに2)多角度の顕微鏡画像スタックに対するマルチアングルの共同学習(joint learning)用の新規モジュールが欠けているためである。本論文では、顕微鏡画像において高品質な共同GESおよびLSSを実現できる、新しい2段階のマルチタスクフレームワークであるPetro-SAMを提案する。具体的には、SAMに基づき、7つの偏光ビューを統合するためのMerge Blockを導入し、消光の問題を効果的に解決する。さらに、検出を改善するために、マルチスケールの特徴融合と色エントロピーの事前知識(prior)を導入する。