膝関節症性骨関節炎に対する自己教師あり学習:非キュレーションの病院データの診断上の限界と予後上の価値

arXiv cs.CV / 2026/3/27

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、自己教師あり学習(SSL)が、画像のみおよび画像+テキスト(マルチモーダル)の病院データを用いて、ImageNetで事前学習した初期化と比べて膝関節症性骨関節炎(OA)の診断および予後予測を改善できるかを評価する。
  • 診断としてのケルグレン・ローレンス(KL)グレード予測について、SSLの結果は一貫していない。画像のみのSSLは線形プロービングの際に有効だが、全モデルをファインチューニングした場合にはImageNetを上回らない。また、マルチモーダルSSLはグレーディング性能を改善しない。
  • 著者らは、診断面での低性能を、非キュレーションの病院事前学習コーパスにおける強い重症度バイアスに起因するとしている。推定では、画像の93%がKLグレード3に対応している。
  • 一方で、同じマルチモーダルSSLの初期化は予後モデリングを大きく改善し、4年後の構造的発症および進行の予測においてImageNetのベースラインを上回る。外部検証でも同様に優れていた。
  • 本結果は、前処理(事前学習)とタスクの分布が乖離する場合、非キュレーションの画像テキストデータは診断には有効でない可能性がある一方で、下流タスクがデータ分布と一致する場合には、予後に対して有用なシグナルを提供し得ることを示唆している。

概要: 本研究では、自己教師あり学習(SSL)が、ImageNetで事前学習した初期化と比べて、診断および予後のための膝関節症(OA)モデリングを改善するかどうかを評価する。OAI、MOST、NYUのコホートから得られた膝のX線画像に対して(i)画像のみのSSLで事前学習した場合、ならびに(ii)キュレーションされていない病院内の膝X線画像と放射線科医の所見を対にして、画像-テキストのマルチモーダルSSLで事前学習した場合を比較した。診断としてのKellgren-Lawrence(KL)グレード予測において、SSLは結果が一貫しない(混合的な)成績を示した。画像のみのSSLは線形プロービング(凍結エンコーダ)中に精度を向上させたが、全体のファインチューニングではImageNet事前学習を上回らなかった。同様に、マルチモーダルSSLもグレーディング性能の向上に失敗した。これは、キュレーションされていない病院の事前学習コーパスに重大なバイアスがあり(推定でKLグレード3が93%)、バランスのとれた診断タスクとの整合性が制限されたことに起因すると考える。対照的に、同じマルチモーダル初期化は予後モデリングを有意に改善した。4年後の構造的発生および進行の予測においてImageNetのベースラインを上回り、外部検証でも同様に良好であった(MOST AUROC: 0.701 vs. 0.599、ラベル付きデータ10%)。全体として、重症度バイアスのために、キュレーションされていない病院の画像-テキストデータは診断の学習には効果がない可能性がある一方で、下流タスクが事前学習データの分布に適合する場合には、予後モデリングに対して強いシグナルを提供する。

広告