円位相表現と幾何学に配慮した最適化による回折顕微鏡(ptychography)画像再構成

arXiv cs.CV / 2026/4/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、従来の反復的再構成の計算コストの高さを課題とし、高スループットやリアルタイム用途を見据えて高速な深層学習手法を動機づけています。
  • 既存手法でしばしば位相をユークリッドなスカラーとして予測しがちな点を、$2\pi$ 周期性を尊重するため、位相を単位円上としてサインとコサインで表現することで解決します。
  • 位相最適化には分化可能な測地線(geodesic)損失を導入し、ブランチカットの不連続を避け、勾配を有界に保ちます。
  • 構造的整合性や円環的一貫性を高めるために、飽和を考慮したデュアルゲイン入力スケーリング、並列エンコーダ分岐、振幅・コサイン・サインの3つのデコーダ、複合損失を組み合わせます。
  • 合成データと実験データの両方で、既存の深層学習手法より振幅・位相ともに再構成精度が一貫して向上し、中〜高周波の位相成分の保持も良好であり、反復ソルバに対して大幅な高速化も示されます。

要旨: 従来の反復型再構成手法は正確ですが計算コストが高いため、高スループットおよびリアルタイムのポアンチョグラフィへの適用が制限されています。近年の深層学習アプローチは速度を向上させますが、しばしば2piの周期性があるにもかかわらず位相をユークリッドなスカラーとして予測するため、ラッピングに伴うアーティファクト、piや-piにおける不連続、ならびに損失と基礎となる信号の幾何学との不一致が生じ得ます。本稿では、単位円上で位相をコサイン成分とサイン成分を用いてモデル化する、ポアンチョグラフィ再構成のための深層学習フレームワークを提案します。位相誤差は微分可能なジオデシック(測地線)損失によって最適化されます。これにより、ブランチカットに起因する不連続を回避し、勾配を有界に保ちます。さらにネットワークには、飽和を考慮したデュアルゲイン入力量子化(入力スケーリング)、並列エンコーダ分岐、振幅・コサイン・サインの3つのデコーダを組み込み、円周方向の整合性と構造的忠実性を促進する複合損失を併用します。合成データセットおよび実験データセットでの実験により、既存の深層学習手法に比べて振幅と位相の両方の再構成が一貫して改善されることが示されました。周波数領域の解析でも、中〜高周波の位相成分の保持がより良好であることが明らかになっています。提案手法は、反復ソルバに対して大幅な速度向上を提供しつつ、物理的に整合した再構成を維持します。