MedGemma 1.5 テクニカルレポート

arXiv cs.AI / 2026/4/8

📰 ニュースSignals & Early TrendsModels & Research

要点

  • この論文は、MedGemma モデルファミリーの新しいリリースである MedGemma 1.5 4B を紹介し、追加されたマルチモーダルの臨床機能によって MedGemma 1 を拡張しています。
  • MedGemma 1.5 は、高次元の医用画像(3D の CT/MRI ボリュームおよび全スライドの病理組織)をサポートし、バウンディングボックスによる解剖学的な局在化、さらに複数時点の胸部 X 線の解析に対応しています。
  • また、検査レポートや電子健康記録(EHR)を含む医療文書理解を改善し、新しい学習データと、長文脈の 3D ボリューム分割や全スライド病理のサンプリングなど、モダリティ固有の手法を導入しています。
  • MedGemma 1 と比較した性能向上として、3D MRI の条件分類で +11%(絶対値)、3D CT の条件分類で +3%、全スライド病理でマクロ F1 が +47%、胸部 X 線の局在化で IoU が +35% 向上したと報告されています。
  • さらに、臨床テキストに基づくベンチマークも改善しており、MedQA の精度で +5%、EHRQA の精度で +22%、4 つの検査レポート抽出データセットにまたがるマクロ F1 で約 +18% を達成しています。また、チュートリアルとともにオープンなリソースとして公開されています。

要旨: MedGemmaコレクションの最新モデルであるMedGemma 1.5 4Bを紹介します。MedGemma 1.5は、追加の機能を統合することでMedGemma 1を拡張しています。高次元の医用画像(CT/MRIボリュームおよび病理の全スライド画像)、バウンディングボックスによる解剖学的局在化、複数時点にわたる胸部X線解析、ならびに医療ドキュメント理解の向上(検査レポート、電子健康記録)です。これらのモダリティを単一のアーキテクチャ内で実現するために必要な革新について、新しい学習データ、長コンテキストの3Dボリュームスライシング、ならびに全スライド病理のサンプリングを含めて詳述します。MedGemma 1 4Bと比較して、MedGemma 1.5 4Bはこれらの新領域で顕著な改善を示し、3D MRIの条件分類精度を11%向上、3D CTの条件分類精度を3%向上(絶対的な改善)させています。全スライド病理画像においては、MedGemma 1.5 4BはマクロF1を47%向上させています。さらに、胸部X線における解剖学的局在化をIntersection over Unionで35%増加させるとともに、縦断的(複数時点)胸部X線解析でマクロ精度を4%達成しています。MedGemma 1に対する改良されたマルチモーダル性能に加えて、MedGemma 1.5はテキストベースの臨床知識と推論も改善し、MedQAの精度を5%向上、EHRQAの精度を22%向上させます。また、4種類の検査レポート情報抽出データセット(EHR Datasets 2, 3, 4およびMendeley Clinical Laboratory Test Reports)で、平均18%のマクロF1を達成しています。以上を踏まえると、MedGemma 1.5は、コミュニティに対する堅牢でオープンなリソースとして位置付けられており、開発者が次世代の医療AIシステムを作り出すための改良された基盤となることを目指して設計されています。MedGemma 1.5を基に構築するためのリソースとチュートリアルは、https://goo.gle/MedGemma で入手できます。