NeuroSeg meets DINOv3:DINOv3の初期化によって2Dの自己教師あり視覚的事前知識を3Dニューロンセグメンテーションへ転移する

arXiv cs.CV / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、「インフレーション」戦略により2Dフィルタを3Dへ持ち上げることで、3Dオペレータを初期化し、DINOv3から2Dの自己教師あり視覚的事前知識を3Dの生体医用ニューロンセグメンテーションモデルへ転送する手法を提案する。

Abstract

DINOv3のような2Dビジュアル基盤モデル(大規模な自然画像で学習された自己教師ありモデル)は、強力なゼロショット汎化を示し、豊かなグローバルな文脈と微細な構造手がかりの両方を捉えることができます。しかし、下流のボリューム型ニューロイメージング向けの、同様の3D基盤モデルは依然として欠けています。これは主に、3D画像の取得が難しいこと、そして高品質な注釈が不足していることが原因です。このギャップに対処するために、本研究ではDINOv3によって学習された2D視覚表現を3Dの生物医学的セグメンテーションモデルへ適応することを提案します。これにより、よりデータ効率よく形態学的に忠実な神経の再構成を可能にします。具体的には、2Dフィルタを3Dオペレータへと「インフレーション(膨張)する」適応戦略を設計し、DINOv3からの意味的な事前知識(プライヤ)を保持しつつ、3Dの神経ボリューム・パッチに適応します。さらに、グラフベースの神経樹状突起再構成における構造の忠実性を明示的に強制するために、トポロジーを考慮したスケルトン(骨格)ロスを導入します。BigNeuron由来の2つと、公開データセットのNeuroFlyおよびCWMBSの2つを含む、4つの神経イメージング・データセットに対する大規模な実験により、SoTA手法に対して再構成精度が一貫して改善することが示されました。平均の改善幅は、Entire Structure Averageで2.9%、Different Structure Averageで2.8%、Percentage of Different Structureで3.8%です。コード: https://github.com/yy0007/NeurINO.