TP-Seg: Task-Prototype Framework for Unified Medical Lesion Segmentation

arXiv cs.CV / 4/2/2026

💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • TP-Seg(Task-Prototype Framework)は、単一のパラメータセットで多様な医用病変のセグメンテーション課題を統合的に扱うことを目的としたフレームワークです。
  • 従来の統合型手法で起きやすい特徴の絡み合い(feature entanglement)や勾配干渉(gradient interference)を抑えるため、タスク条件付きアダプタとデュアルパスのエキスパート構造で共有表現とタスク固有表現のバランスを取ります。
  • プロトタイプガイド付きタスクデコーダでは、学習可能なタスク・プロトタイプをセマンティックアンカーとして用い、クロスアテンションによりタスク固有の前景・背景の微細な意味をモデル化します。
  • TP-Segは「装飾的な追加機構なし」で、複数モダリティを含む8つの病変セグメンテーション課題で、専門モデル・汎用モデル・既存の統合手法を一貫して上回り、汎化性・スケーラビリティ・臨床適用可能性を示したと報告しています。

Abstract

Building a unified model with a single set of parameters to efficiently handle diverse types of medical lesion segmentation has become a crucial objective for AI-assisted diagnosis. Existing unified segmentation approaches typically rely on shared encoders across heterogeneous tasks and modalities, which often leads to feature entanglement, gradient interference, and suboptimal lesion discrimination. In this work, we propose TP-Seg, a task-prototype framework for unified medical lesion segmentation. On one hand, the task-conditioned adapter effectively balances shared and task-specific representations through a dual-path expert structure, enabling adaptive feature extraction across diverse medical imaging modalities and lesion types. On the other hand, the prototype-guided task decoder introduces learnable task prototypes as semantic anchors and employs a cross-attention mechanism to achieve fine-grained modeling of task-specific foreground and background semantics. Without bells and whistles, TP-Seg consistently outperforms specialized, general and unified segmentation methods across 8 different medical lesion segmentation tasks covering multiple imaging modalities, demonstrating strong generalization, scalability and clinical applicability.