広告

Perturb-and-Restore:不均衡な染色体異常検出のためのシミュレーション駆動型構造拡張フレームワーク

arXiv cs.CV / 2026/4/2

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、「Perturb-and-Restore(P&R)」という、構造的染色体異常検出データセットにおける深刻なクラス不均衡とデータ不足を緩和するためのシミュレーション駆動型フレームワークを提案する。
  • P&Rは、正常染色体のバンディングパターンを摂動させることで合成異常染色体を生成し、その後、連続した染色体内容とエッジを再構成する復元拡散ネットワークを用いることで、希少な実データの異常サンプルへの依存を低減する。
  • さらに、「エネルギーガイド付き適応サンプリング」により学習データの品質を向上させる。これは、実サンプルのエネルギー分布から導出したエネルギースコアに基づいて、高品質な合成サンプルを優先するオンライン戦略である。
  • 著者らは、260,000枚超の染色体画像からなる大規模な構造異常データセットを構築しており、24カテゴリにまたがる4,242件の異常サンプルを含む。カテゴリ全体で平均の感度が8.92%、適合率が8.89%、F1が13.79%向上したという、最先端の結果を報告する。

Abstract

構造的な染色体異常を検出することは、遺伝性疾患の正確な診断と管理にとって重要です。しかし、十分な構造異常データを収集することは臨床実務において非常に困難でコストもかかり、さらに、すべての異常タイプを容易に収集できません。その結果、重度のクラス不均衡と異常染色体データの希少性により、深層学習手法は大きな性能劣化に直面します。この課題に対処するために、我々は、染色体異常検出におけるデータ不均衡を効果的に緩和する、シミュレーション駆動の構造拡張フレームワークである「Perturb-and-Restore(P&R)」を提案します。P&Rフレームワークは2つの主要コンポーネントから構成されます:(1)Structure Perturbation and Restoration Simulation(構造摂動と復元シミュレーション)。正常染色体の帯状パターンを摂動させて合成の異常染色体を生成し、その後、連続した染色体の内容とエッジを再構成する復元拡散ネットワークを用いることで、希少な異常サンプルへの依存を排除します;(2)Energy-guided Adaptive Sampling(エネルギーガイド付き適応サンプリング)。エネルギースコアに基づくオンライン選択戦略であり、実データサンプルのエネルギー分布を参照することで、高品質な合成サンプルを動的に優先します。我々の手法を評価するために、24カテゴリにわたる4,242件の異常サンプルを含む、26万枚を超える染色体画像からなる包括的な構造異常データセットを構築します。実験結果は、P&Rフレームワークが最先端(SOTA)の性能を達成し、全カテゴリにわたって感度で平均8.92%、適合率で平均8.89%、F1スコアで平均13.79%の改善により、既存手法を上回ることを示しています。

広告