走査型電子顕微鏡画像解析のためのMixture of Experts基盤モデル

arXiv cs.LG / 2026/4/8

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、走査型電子顕微鏡(SEM)画像解析における“最初の”基盤モデルであると主張し、大規模な複数機器・複数条件の科学的顕微鏡画像データセットで事前学習したと述べている。
  • 自己教師ありトランスフォーマー手法を用いて、このモデルは多様な材料系および撮像条件にわたって汎化することを意図した、転移可能な表現を学習する。
  • 著者らは、ディフォーカス画像からフォーカス画像への変換(defocus-to-focus)によりモデルの有用性を示しており、ペアとなる教師データなしで、ディフォーカス入力から焦点の合った詳細の復元を達成している。
  • 報告された結果では、複数の評価指標において最先端手法よりも性能が向上していることが示されており、顕微鏡パイプラインの自動化に対するより強い可能性を示唆している。
  • 本研究は、SEMにおける基盤モデリングを、労力の大きいタスク固有の開発を減らし、材料探索ワークフローを加速するための、新たな適応可能なモデルの系統として位置付けている。

Abstract

走査型電子顕微鏡(SEM)は、幅広い構造・化学・機能に関する調査において高解像度のイメージングを可能にし、現代の材料科学に不可欠です。しかし、SEMイメージングは、タスク固有のモデルと、手作業を要する負荷の高い取得プロセスによって制約されており、多様な用途へのスケール拡大が困難になっています。ここでは、多様な材料系およびイメージング条件にわたって汎化できる最初のSEM画像用基盤モデルを導入します。このモデルは、多インストゥルメントかつ多条件の科学的マイクログラフの大規模コーパスで事前学習されており、汎化を可能にします。自己教師ありトランスフォーマー・アーキテクチャを活用することで、当社のモデルは、豊かで転用可能な表現を学習し、さまざまな下流タスクに対して微調整または適応できるようになります。説得力のある実例として、焦点ずれ(defocus)から焦点合わせ(focus)への画像変換、すなわち自動顕微鏡パイプラインにおいて不可欠であるにもかかわらず十分に研究されてこなかった課題に焦点を当てます。提案手法は、対応付けられた教師なしの状況で、焦点ずれ入力から焦点の合った詳細を復元するだけでなく、複数の評価指標において最先端手法を上回ります。本研究は、基盤表現学習と現実のイメージング要件を橋渡しすることで、材料探索を加速しうる、新しいクラスの適応可能なSEMモデルのための基盤を築きます。