ASGNet:自動ポリープセグメンテーションのための適応的スペクトルガイダンスネットワーク

arXiv cs.CV / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ASGNetという適応的スペクトルガイダンスネットワークを提案し、従来モデルの「空間のみ」の知覚に起因する限界を解消することで大腸内視鏡画像の自動ポリープセグメンテーション性能を高めることを目指しています。
  • ASGNetは、スペクトル特徴とグローバル属性を組み合わせ、スペクトルガイド付きノンローカル知覚モジュールにより局所情報と大域情報を同時に集約して、ポリープ構造の全体把握と境界の精緻化を促します。
  • さらに、多ソースのセマンティック抽出器を導入し、高レベルの意味情報を活用してポリープの事前ローカライズをより確実にします。
  • 密なクロスレイヤー・インタラクション・デコーダにより、複数層から得た多様な情報を統合・強化して、最終的なセグメンテーション精度を向上させます。
  • 5つの代表的ベンチマークでの評価では、ASGNetが21の最先端手法を上回ることが定量・定性の両面で示され、コードはGitHubで公開予定とされています。

Abstract

ポリープの早期発見と除去は、大腸がんの発症リスクを低減できます。しかし、ポリープは多様な形態を持ち、背景が複雑で、さらにしばしば隠れた存在であるため、内視鏡画像におけるポリープのセグメンテーションは非常に困難です。既存の深層学習ベースのポリープセグメンテーション手法が有望な性能を示しているにもかかわらず、それらの知覚能力は主に空間領域における隣接ピクセル間の強い空間相関のため、局所領域に偏っています。この制約により、ポリープの完全な構造を捉えることが難しくなり、結果として最適でないセグメンテーション結果につながります。本論文では、スペクトル特徴とグローバル属性を統合することで、空間知覚の限界に対処する新しい適応的スペクトルガイダンスネットワーク ASGNet を提案します。具体的には、まず、局所情報とグローバル情報を共同で集約するスペクトルガイド付き非ローカル知覚モジュールを設計し、それによってポリープ構造の識別性を高め、境界を精緻化します。さらに、多ソースのセマンティック抽出器を導入し、高レベルの豊富なセマンティック情報を統合して、ポリープの事前の局在化を支援します。加えて、密なクロスレイヤー相互作用デコーダを構築し、異なる層からの多様な情報を効果的に統合し、それを強化して、正確なポリープセグメンテーションのための高品質な表現を生成します。広範な定量的および定性的な結果により、提案手法 ASGNet が、広く用いられている 5 つのポリープセグメンテーションベンチマークにおいて、21 の最先端手法を上回ることが示されます。コードは以下で公開予定です:https://github.com/CSYSI/ASGNet.