深層学習ベースの心エコー（エコーカーディオグラフィ）セグメンテーションモデルの学習中における真値（GT）エラーを検出し、修復する

arXiv cs.CV / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

手作業で作成される心エコー（echocardiography）のGTラベルは、ランダムな誤りや系統的バイアスを含み得るため、深層学習セグメンテーションの頑健性を評価しつつGT誤りを扱う手法が検討されています。
CAMUSデータセット上で3種類のGTエラーをシミュレートし、lossベースの検出法とVariance of Gradients（VOG）ベースの検出法を比較した結果、VOGが学習中に誤ったGTラベルを高い精度でフラグ付けできたと報告されています。
さらに、疑わしい誤りラベルを疑似ラベリングで“refurbish（修復）”するアプローチを提案し、エラーが高い条件ほど性能改善が大きくなることが示されています。
一方で、標準的なU-Netはランダムラベル誤りや中程度の系統的誤り（最大50%）に対しても比較的強い性能を維持できるため、検出・修復は特に高エラー環境で有効と結論づけています。

Abstract

深層学習に基づく医療画像セグメンテーションは一般に、手動アノテーションによって得られる正解ラベル（GT）に依存しますが、これらはランダムな誤りや体系的なバイアスに影響されやすいことがあります。本研究では、心エコー（echo）セグメンテーションにおけるこのような誤りに対する深層学習モデルの頑健性を調べ、学習中に誤ったラベルを検出して修復（refurbishing）する新しい戦略を評価します。CAMUSデータセットを用いて3種類のエラーをシミュレーションし、損失に基づくGTラベル誤り検出手法と、勾配の分散（Variance of Gradients: VOG）に基づく手法を比較します。また、疑わしい誤ったGTラベルを修復するための疑似ラベリング（pseudo-labelling）アプローチも提案します。提案手法の性能を、さまざまなエラーレベルのもとで評価します。その結果、VOGは学習中に誤ったGTラベルをフラグ付けするのに非常に有効であることが分かりました。一方で、標準的なU-Netは、ランダムなラベル誤りおよび中程度の体系的誤りのもとで強い性能を維持しました（最大50%まで）。検出と修復のアプローチは、特に高エラー条件下で性能を改善しました。