NucEval：核インスタンスセグメンテーションのための堅牢な評価フレームワーク

arXiv cs.CV / 2026/5/6

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

本論文は、計算病理における核インスタンスセグメンテーションの評価方法を改善することを目的とした統一型フレームワーク「NucEval」を提案しています。
取り上げられてこなかった評価パイプライン上の4つの課題（曖昧な領域、スコア正規化、重なり合うインスタンス、境界の不確実性）を特定し、それぞれに対応する具体的な解決策を示しています。
NucEvalは、NuInsSegデータセットに加えて2つの外部データセットでも検証され、CNNおよびViTベースのセグメンテーションモデルを用いて、提案変更がインスタンスセグメンテーション指標に与える影響を示しています。
著者らは、コード、ガイドライン、利用例を公開し、研究間での堅牢かつ再現可能な評価を支援します。
総じて、本研究は核インスタンスセグメンテーションの性能評価において、モデルだけでなく評価手法自体が報告値を大きく左右し得ることを主張しています。

Abstract

計算病理学において、核インスタンスセグメンテーションは、多くの下流の臨床アプリケーションにつながる基礎的なタスクです。深層学習の登場により、このタスクに対して畳み込みニューラルネットワーク（CNN）やビジョントランスフォーマー（ViT）を含む多くの手法が提案されており、性能をさらに高めるための、機械学習ベースおよび非機械学習ベースの前処理・後処理手法も併せて検討されています。しかし、あまり注目されてこなかった重要な側面の1つは、評価パイプラインです。本研究では、核インスタンスセグメンテーション評価に関連する4つの主要な問題を特定し、それぞれに対応する解決策を提案します。提案する修正、すなわち「曖昧な領域の取り扱い」「スコア正規化」「重なり合うインスタンス」「境界の不確実性」は、NucEvalと呼ばれる統一的なフレームワークに統合されており、核インスタンスセグメンテーションの頑健な評価を可能にします。我々はこのパイプラインを、特に本研究に適した独自の特性を提供するNuInsSegデータセットを用いて評価し、さらに、インスタンスセグメンテーション指標に対するこれらの修正の影響を示すために、CNNおよびViTベースの核インスタンスセグメンテーションモデル3つと、2つの追加の外部データセットも用いて検証します。コードは、完全なガイドラインおよび説明用の例とともに、以下で公開されています: https://github.com/masih4/nuc_eval.