物理インフォームドなNV-Raw2Insights-US AIによる適応型超音波画像化
返却形式: {"translated": "翻訳されたHTML"}導入
超音波は、安全性、リアルタイム性、携帯性、低コストを理由に、最も広く用いられている医用画像診断の手法の一つです。何十年もの間、超音波画像は、手作業で設計された再構成パイプラインによって生成されてきました。このパイプラインは、豊富な生のセンサー計測値を最終画像へ圧縮すると同時に、身体全体を通して音速が一定であるなど、物理に関する単純化した仮定も置いています。
AIと基盤モデルの時代において、自然に次の疑問が生まれます。従来のビームフォーミングのパイプラインを超えて、超音波の生のセンサー・データから直接学習し、再構成の際に通常捨てられてしまう情報を活用できるのでしょうか?そして、そうできるなら、どのような新しい能力が解放されるのでしょうか?
NVIDIAと、Siemens Healthineersの研究者が共同でこれらの問いに答えを出す取り組みを行いました。今回の成果として、私たちは NV-Raw2Insights-US と呼ばれる再構成モデルを公開します。
Raw2Insights
超音波の本質は、画像ではありません。音です。臨床の現場で最終的に画面に映るのは、体から戻ってくる何百万もの微小なエコーをもとに再構成されてできた画像です。しかし、その再構成の過程で、元の信号の多く――音がどのように組織を伝わったかという豊かな情報――は単純化されるか、失われてしまいます。
私たちのアプローチはもっと早い段階から始まります。完成した画像を扱うのではなく、NV-Raw2Insights-USは超音波プローブによって取得された生の信号――音が実際に身体とどのように相互作用するかを最も近い形で表したもの――から直接学習します。これによりモデルは、より注意深く「耳を傾け」、それぞれの患者がそれらの音波を独自に形作る方法を理解できます。私たちのビジョンは、超音波画像診断のためのエンドツーエンドAIを実現することであり、これはそのビジョンに向けた最初のステップです。この種のモデルを Raw2Insights と呼びます。
この最初のRaw2Insightsの適用例では、適応的な画像フォーカシングのために音速を推定します。これにより、各患者について個別化された音速マップを生成し、それを用いてリアルタイムで画像を補正できるシステムが得られます。かつて複雑で時間のかかる計算が必要だったものが、いまでは1回のAI処理で実行されます。これが 生の超音波チャネルデータ から 実行可能な洞察 への転換です。つまり、超音波画像を単に処理するのではなく、各患者固有の物理に能動的に理解し適応するAIシステムです。
デプロイ
一般に、生の超音波チャネルデータは、高帯域幅のため臨床グレードの超音波スキャナでは容易にアクセスできません。Holoscan Sensor Bridge(HSB)は、NVIDIAが開発したオープンソースのFPGA IPであり、(RDMA over Converged Ethernet)。Altera Agilex-7 FPGA開発キットとNVIDIA Holoscan Sensor Bridgeを組み合わせることで、ACUSON Sequoia超音波スキャナのDisplayPort出力から、生の超音波チャネルデータをストリーミングできます。この技術を Data over DisplayPort と呼びます。NVIDIA HSBは、データをパケット化し、データ収集およびAI推論のためにイーサネット経由でNVIDIA IGXへ送信します。これは、最新の高性能コンピューティングが…
既存のスキャナー・アーキテクチャに、高帯域幅のDisplayPort出力を用いて統合することができます。
我々は、NVIDIA Holoscanを使ってNV-Raw2Insights-USを展開します。これは、NVIDIA IGX ThorやNVIDIA DGX Sparkのようなシステム上で、高い性能とリアルタイム処理を実現するよう設計されたエッジAIセンサー処理プラットフォームです。
データがGPUメモリ内に入ると、NV-Raw2Insights-USはBlackwellクラスのGPU上で加速された推論を実行し、患者ごとの音速推定値を生成します。この推定値は超音波スキャナーへストリーミングで返され、ライブ画像ストリームでのフォーカス改善を可能にします。
システム機能
このデモ用アーキテクチャは、開発とデプロイの両方において柔軟性を提供します。
ソフトウェアのみでの統合: Data over DisplayPortを用いたソフトウェアのみの変更により、既存の医療機器にNVIDIAのアクセラレーションを適用することが可能です。
ソフトウェア定義の超音波: このソフトウェア定義のアプローチにより、ソフトウェア更新を通じて継続的な改善が可能になります。
モジュール拡張: 生の超音波チャネルデータがすでにGPUメモリにある状態なら、新しいAIモデルをシームレスに統合できます。
締めくくりの視点
従来のアルゴリズムから、超音波インテリジェンスをAI駆動のRaw2Insightsパイプラインへ切り替えることで、AIネイティブなイメージングへのスケーラブルな道を切り開きます。再構成画像ではなく、生の超音波チャネルデータから直接学習することで、NV-Raw2Insights-USは従来の前提によって生じる誤差を低減し、各患者に合わせて効果的にイメージングを適応させます。
このアーキテクチャは、今日の画像の明瞭さを向上させるだけでなく、次世代のAI搭載診断システムに向けたモジュール型の基盤も確立します。ここでNV-Raw2Insights-USの上に開発を始めることができます( GitHub / モデルの重み / データセット)。
参考文献
- 「Ultrasound Autofocusing: Common Midpoint Phase Error Optimization via Differentiable Beamforming」 IEEE Transactions on Medical Imaging, 第45巻 第2号、2026年2月。 https://ieeexplore.ieee.org/document/11154013
- 「Investigating Pulse-Echo Sound Speed Estimation in Breast Ultrasound with Deep Learning」 arXiv:2302.03064, 2023年。 https://arxiv.org/abs/2302.03064
- NVIDIA Holoscan SDKドキュメント、https://developer.nvidia.com/holoscan-sdk
謝辞
本プロジェクトはシーメンス・ヘルスニアーズと緊密に連携して実施しました。AI&アドバンスト・プラットフォーム・グループのイスマイル・グラカルおよびリッカルド・ロフトマンによる直接的な協力を含め、同社のご支援に感謝いたします。
本技術は調査・研究開発中であり、米国またはその他の国において販売のための承認を得ておらず、販売されていません。将来的な提供可否は保証できません。






