RADMI:モデル不確実性の代理指標としての潜在情報集約

arXiv cs.CV / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • RADMI(Resolution-Aggregated Decoder Mutual Information)は、高価なアンサンブルや複数の確率的フォワードパスを使わずに、セグメンテーションネットワークのエピステミック不確実性を推定する単一パス手法である。
  • これはデコーダの連続する層間で相互情報量(MI)を計算し、層間MIが高いほど予測不確実性も高くなることを示しており、とりわけ曖昧なクラス境界付近で顕著になる。
  • 地震ファシスのセグメンテーションベンチマークでは、RADMIは単一パス手法の中で深いアンサンブル不確実性との相関が最も高く、最良ベースラインに対してPearsonで5.5%、Spearmanで10.7%上回った。
  • さらにRADMIは、建築(アーキテクチャ)の変更なしで、境界に局所化した鋭い不確実性マップを生成でき、正規化された情報フローの線形集約を不確実性の効率的な代理指標として用いる。
  • 総じて、本研究はエンコーダ–デコーダ型モデルにおいてデコーダ層間の情報フロー信号を活用し、密な予測タスク向けにスケーラブルな不確実性推定を提案するものである。

Abstract

知識(エピステミック)不確実性の推定は、深層学習システムの出力が信頼できない可能性がある領域を特定するために不可欠です。しかし、既存の手法では計算コストの高いアンサンブル手法や複数の確率的フォワードパスが必要となり、セグメンテーションのような密な予測(dense prediction)タスクへのスケーラビリティが制限されています。本稿では、セグメンテーションネットワークにおける連続するデコーダ層間の相互情報量(MI)を測定することで予測不確実性を推定する、単一パス手法であるResolution-Aggregated Decoder Mutual Information(RADMI)を提案します。層間の相互情報量が高いほど予測不確実性と相関することを観察します。これは、クラス境界のような曖昧な領域で、ネットワークが矛盾する文脈情報を統合しなければならないためです。地震ファシース(seismic facies)セグメンテーションのベンチマークで評価したところ、RADMIはすべての単一パス手法の中で最も高い相関を示し、深いアンサンブル不確実性との相関において次点のベースラインをPearsonで5.5%、Spearmanで10.7%上回りました。空間的な精度を欠く、または大きな計算オーバーヘッドを要求するベースラインと比較して、RADMIはアーキテクチャの修正なしに、鋭く境界に局在した不確実性マップを生成します。本結果は、正規化された情報フローの線形集約が、エンコーダ・デコーダ型アーキテクチャにおける予測不確実性のための、原理に基づいた効率的な代理指標になることを示唆しています。