広告

複合BCE-Dice-Lovász損失を用いたドメインガイドYOLO26による多クラス胎児頭部超音波セグメンテーション

arXiv cs.CV / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、プロンプト不要のパイプラインを提案し、単一のYOLO26-Segのフォワードパスで脳、CSP、側脳室を同時に検出・セグメンテーションすることで、胎児頭部超音波のセグメンテーションに取り組む。
  • 逆頻度に基づくクラス重み付けを用いた複合BCE-Dice-Lovász損失を導入し、クラス不均衡への対応を改善するために、ランタイムのモンキーパッチ適用によりYOLO26の学習へ統合する。
  • 脳境界に対する解剖学的文脈を保持するドメインガイド付きコピー&ペースト拡張により、少数クラスの学習を向上させる。
  • 575枚のホールドアウトテスト画像で高い性能を報告し、平均Diceは0.9253でありベースライン0.9012に対して+2.68パーセンテージポイントの向上を達成した。さらに、寄与と注釈品質および不均衡への感度を分析するアブレーションも含む。

Abstract

胎児の頭部構造を周産期超音波から分割することは、産科画像診断における実用上のボトルネックであり続けています。公開データセットとともに提案された現在の最先端のベースラインは、クラスごとのDice損失とLov\'{a}sz損失を用いてSegment Anything Modelを適用しますが、それでもテスト時にはバウンディングボックスのプロンプトに依存しています。私たちは、YOLO26-Segの上にプロンプト不要のパイプラインを構築し、3つの構造(Brain, Cavum Septi Pellucidi(CSP), Lateral Ventricles(LV))を単一のフォワードパスで同時に検出・分割します。私たちのアプローチの中心となる主要な3つの改良点は次のとおりです:(i) 逆頻度クラス重み付けを伴う複合BCE-Dice-Lov\'{a}sz分割損失を、実行時のモンキーパッチによりYOLO26の学習ループへ注入すること;(ii) 脳境界に対する解剖学的位置関係を考慮しながら、少数クラスの構造を移植するドメイン誘導型コピー&ペースト拡張;(iii) データリークを防ぐための患者間での層化分割です。575枚の保持されたテスト画像において、複合損失バリアントは平均Dice係数0.9253を達成し、ベースライン(0.9012)を2.68パーセンテージポイント上回ります。これは、3つの前景クラスのみを報告しているにもかかわらずであり、一方でベースラインの報告平均には扱いやすい背景クラスが含まれています。さらに、各構成要素を個別にアブレーションし、CSPとLVに対するアノテーション品質およびクラス不均衡の影響について議論します。

広告