トランスフォーマー強化残差ネットワークによるリアルタイム操作者ガイダンスのための3D超音波由来疑似CT合成

arXiv cs.CV / 2026/5/7

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 本研究は、超音波からCTに似た疑似CT(UD-pCT)ボリュームを生成することで、従来CTの放射線被ばくを減らしつつ、超音波のオペレーター依存性や組織の定量化不足による診断不確実性を補うことを目指している。
  • TRUSTEDデータセットの3D腎臓超音波とCTのペアデータを、ランドマークに基づくマルチモーダル登録で位置合わせし、教師あり学習用の高品質な入力を作成している。
  • 中核モデルのBottleneck Transformer Residual U-Net3D(BT-ResUNet3D)は、3D残差エンコーダ・デコーダにトランスフォーマーのボトルネックを組み込み、局所の解剖学的微細構造と3D内の長距離依存関係の双方を扱えるようにしている。
  • 3D Conditional PatchGAN判別器を用いることで、生成した疑似CTの局所的な構造のリアリティを高め、PSNR/SSIMで既存ベースラインより優れたと報告している。
  • UD-pCTは操作者のリアルタイムな解剖学的参照として取得ばらつきを抑え、不要なCT検査を減らす可能性がある一方、ペアデータが比較的小さいことが一般化の制約になり得ると述べている。

Abstract

コンピュータ断層撮影(CT)は臨床診断や画像誘導下の介入に不可欠である一方、患者を電離放射線に曝露するため、より安全な画像化代替法の開発が動機づけられている。超音波(US)は非電離で広く利用可能であるが、高度に操作者依存であり、定量的な組織特性評価が欠けている。その結果、診断の不確実性や不要なCT検査につながることが多い。本研究では、物理的に正確なハウンズフィールド単位(Hounsfield Units)を再現することを目的としない、USから推定した3D超音波由来の擬似CT(UD-pCT)フレームワークを提示する。この枠組みは、USから推論されるCT様の解剖学的参照ボリュームを生成する。TRUSTEDデータセットに含まれる3D腎臓USおよびCTボリュームを、まずランドマークベースのマルチモーダル登録パイプラインによって空間的にアラインメントし、教師あり学習のための高品質な対となる入力を作成する。次に、敵対的フレームワークの学習に用いる。提案手法のBottleneck Transformer Residual U-Net3D(BT-ResUNet3D)モデルは、トランスフォーマーボトルネックを備えた3D残差エンコーダーデコーダ生成器を採用し、微細な局所解剖学的構造と、長距離のボリューム依存性の双方を効果的にモデリングできるようにする。さらに、3D Conditional PatchGAN判別器が、合成された擬似CTボリュームにおける局所的な構造の現実性を強制する。PSNRとSSIMを用いた定量評価により、本手法は構造の忠実性および知覚的画像品質の点で確立されたベースラインを上回ることが示される。UD-pCTボリュームは、操作者のガイダンスのためのリアルタイムな解剖学的参照を提供し、撮像のばらつきや不要なCT使用を減らせる可能性がある。本研究の限界は、対となるデータセットが比較的小さいことであり、提案モデルの汎用性が制限される可能性がある。

トランスフォーマー強化残差ネットワークによるリアルタイム操作者ガイダンスのための3D超音波由来疑似CT合成 | AI Navigate