物理インフォームドNV-Raw2Insights-US AIによる適応型超音波イメージング

Hugging Face Blog / 2026/4/28

💬 オピニオンIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

この記事は、超音波の生データから臨床的に有用なインサイトを導く「Physics-Informed NV-Raw2Insights-US」AIパイプラインを用いた、適応型の超音波イメージング手法を紹介しています。
モデルに物理の知見を組み込むことで、純粋なデータ駆動だけに頼らずに、再構成品質の向上や学習依存の低減を狙っています。
このアプローチは、条件の変化に応じて超音波画像形成をより柔軟にすることで、より良い画像生成と解釈を支援するものとして位置づけられています。
医用画像タスクにおいて、物理（ドメイン知識）と深層学習を組み合わせるための道筋を示唆しています。
全体として、物理インフォームドAIが超音波イメージングの性能と頑健性を従来ベースラインより高め得ることを強調しています。

記事一覧へ

物理インフォームドなNV-Raw2Insights-US AIによる適応型超音波画像化

エンタープライズ + 記事公開日 2026年4月28日

返却形式: {"translated": "翻訳されたHTML"}

導入

超音波は、安全性、リアルタイム性、携帯性、低コストを理由に、最も広く用いられている医用画像診断の手法の一つです。何十年もの間、超音波画像は、手作業で設計された再構成パイプラインによって生成されてきました。このパイプラインは、豊富な生のセンサー計測値を最終画像へ圧縮すると同時に、身体全体を通して音速が一定であるなど、物理に関する単純化した仮定も置いています。

AIと基盤モデルの時代において、自然に次の疑問が生まれます。従来のビームフォーミングのパイプラインを超えて、超音波の生のセンサー・データから直接学習し、再構成の際に通常捨てられてしまう情報を活用できるのでしょうか？そして、そうできるなら、どのような新しい能力が解放されるのでしょうか？

NVIDIAと、Siemens Healthineersの研究者が共同でこれらの問いに答えを出す取り組みを行いました。今回の成果として、私たちは NV-Raw2Insights-US と呼ばれる再構成モデルを公開します。

Raw2Insights

超音波の本質は、画像ではありません。音です。臨床の現場で最終的に画面に映るのは、体から戻ってくる何百万もの微小なエコーをもとに再構成されてできた画像です。しかし、その再構成の過程で、元の信号の多く――音がどのように組織を伝わったかという豊かな情報――は単純化されるか、失われてしまいます。

私たちのアプローチはもっと早い段階から始まります。完成した画像を扱うのではなく、NV-Raw2Insights-USは超音波プローブによって取得された生の信号――音が実際に身体とどのように相互作用するかを最も近い形で表したもの――から直接学習します。これによりモデルは、より注意深く「耳を傾け」、それぞれの患者がそれらの音波を独自に形作る方法を理解できます。私たちのビジョンは、超音波画像診断のためのエンドツーエンドAIを実現することであり、これはそのビジョンに向けた最初のステップです。この種のモデルを Raw2Insights と呼びます。

この最初のRaw2Insightsの適用例では、適応的な画像フォーカシングのために音速を推定します。これにより、各患者について個別化された音速マップを生成し、それを用いてリアルタイムで画像を補正できるシステムが得られます。かつて複雑で時間のかかる計算が必要だったものが、いまでは1回のAI処理で実行されます。これが 生の超音波チャネルデータ から 実行可能な洞察 への転換です。つまり、超音波画像を単に処理するのではなく、各患者固有の物理に能動的に理解し適応するAIシステムです。

デプロイ

一般に、生の超音波チャネルデータは、高帯域幅のため臨床グレードの超音波スキャナでは容易にアクセスできません。Holoscan Sensor Bridge（HSB）は、NVIDIAが開発したオープンソースのFPGA IPであり、（RDMA over Converged Ethernet）。Altera Agilex-7 FPGA開発キットとNVIDIA Holoscan Sensor Bridgeを組み合わせることで、ACUSON Sequoia超音波スキャナのDisplayPort出力から、生の超音波チャネルデータをストリーミングできます。この技術を Data over DisplayPort と呼びます。NVIDIA HSBは、データをパケット化し、データ収集およびAI推論のためにイーサネット経由でNVIDIA IGXへ送信します。これは、最新の高性能コンピューティングが…

既存のスキャナー・アーキテクチャに、高帯域幅のDisplayPort出力を用いて統合することができます。

我々は、NVIDIA Holoscanを使ってNV-Raw2Insights-USを展開します。これは、NVIDIA IGX ThorやNVIDIA DGX Sparkのようなシステム上で、高い性能とリアルタイム処理を実現するよう設計されたエッジAIセンサー処理プラットフォームです。

データがGPUメモリ内に入ると、NV-Raw2Insights-USはBlackwellクラスのGPU上で加速された推論を実行し、患者ごとの音速推定値を生成します。この推定値は超音波スキャナーへストリーミングで返され、ライブ画像ストリームでのフォーカス改善を可能にします。

システム機能

このデモ用アーキテクチャは、開発とデプロイの両方において柔軟性を提供します。

ソフトウェアのみでの統合： Data over DisplayPortを用いたソフトウェアのみの変更により、既存の医療機器にNVIDIAのアクセラレーションを適用することが可能です。
ソフトウェア定義の超音波： このソフトウェア定義のアプローチにより、ソフトウェア更新を通じて継続的な改善が可能になります。
モジュール拡張： 生の超音波チャネルデータがすでにGPUメモリにある状態なら、新しいAIモデルをシームレスに統合できます。

締めくくりの視点

従来のアルゴリズムから、超音波インテリジェンスをAI駆動のRaw2Insightsパイプラインへ切り替えることで、AIネイティブなイメージングへのスケーラブルな道を切り開きます。再構成画像ではなく、生の超音波チャネルデータから直接学習することで、NV-Raw2Insights-USは従来の前提によって生じる誤差を低減し、各患者に合わせて効果的にイメージングを適応させます。

このアーキテクチャは、今日の画像の明瞭さを向上させるだけでなく、次世代のAI搭載診断システムに向けたモジュール型の基盤も確立します。ここでNV-Raw2Insights-USの上に開発を始めることができます（ GitHub / モデルの重み / データセット）。

参考文献

「Ultrasound Autofocusing: Common Midpoint Phase Error Optimization via Differentiable Beamforming」 IEEE Transactions on Medical Imaging, 第45巻第2号、2026年2月。 https://ieeexplore.ieee.org/document/11154013
「Investigating Pulse-Echo Sound Speed Estimation in Breast Ultrasound with Deep Learning」 arXiv:2302.03064, 2023年。 https://arxiv.org/abs/2302.03064
NVIDIA Holoscan SDKドキュメント、https://developer.nvidia.com/holoscan-sdk

謝辞

本プロジェクトはシーメンス・ヘルスニアーズと緊密に連携して実施しました。AI＆アドバンスト・プラットフォーム・グループのイスマイル・グラカルおよびリッカルド・ロフトマンによる直接的な協力を含め、同社のご支援に感謝いたします。

本技術は調査・研究開発中であり、米国またはその他の国において販売のための承認を得ておらず、販売されていません。将来的な提供可否は保証できません。

この記事で言及されているモデル 1

この記事で言及されているデータセット 1

この著者によるその他の情報

Jetson Orin Nano SuperでのGemma 4 VLAデモ

2026年4月22日

合成ペルソナで実在する人口統計に基づき、韓国のAIエージェントを実装する方法

2026年4月21日

コミュニティ

編集プレビュー

テキスト入力欄にドラッグして、音声や動画をアップロードできます。貼り付けることもできます。ここをクリックしてください。

ここをタップまたは貼り付けて画像をアップロード

· 登録またはログインしてコメント

賛成

この記事で言及されているモデル 1

この記事で言及されているデータセット 1

おじが作った“Gemが生まれる仕組み”。AIリアル導入でチームが変わった

note

GPT image2.0｜対話型アートディレクション支援に進化

note

ＡＩに評価してもらう前に、こっちがＡＩを評価する

note

60代から先のキャリアプラン：ChatGPTを初めて使ったとき～最初の一歩は、思ったより簡単だった

note

生成AIは、日本文化をよく学習している？

note

物理インフォームドNV-Raw2Insights-US AIによる適応型超音波イメージング

要点

物理インフォームドなNV-Raw2Insights-US AIによる適応型超音波画像化

導入

Raw2Insights

デプロイ

システム機能

ソフトウェアのみでの統合： Data over DisplayPortを用いたソフトウェアのみの変更により、既存の医療機器にNVIDIAのアクセラレーションを適用することが可能です。

ソフトウェア定義の超音波：このソフトウェア定義のアプローチにより、ソフトウェア更新を通じて継続的な改善が可能になります。

モジュール拡張：生の超音波チャネルデータがすでにGPUメモリにある状態なら、新しいAIモデルをシームレスに統合できます。

締めくくりの視点

参考文献

謝辞

この記事で言及されているモデル 1

この記事で言及されているデータセット 1

Jetson Orin Nano SuperでのGemma 4 VLAデモ