要旨: 入力と関連付けることができる、プロトタイプに基づく解釈可能な表現に依存する深層ネットワークは、高い精度と内在する解釈可能性のバランスを取るために大きな注目を集めており、医療のような重要な領域に適しています。しかし、これらのモデルは学習データへの依存によって制約されており、分布シフトに対する頑健性が損なわれます。テスト時適応(TTA)は、パラメータと統計量を更新することで深層ネットワークの頑健性を高めますが、解釈可能モデルのプロトタイプは、この目的のために検討されていません。そこで本研究では、中間のプロトタイプ信号を活用し、モデル出力のみに依存しない、プロトタイプ化モデルのための汎用フレームワークであるProtoTTAを提案します。ProtoTTAは、プロトタイプ類似度分布のエントロピーを最小化することで、シフトしたデータに対してより自信のある、かつプロトタイプ固有の活性化を促します。安定性を維持するために、幾何学的フィルタリングを用いて、信頼できるプロトタイプ活性を持つサンプルに更新を限定します。これには、プロトタイプ重要度の重みとモデルの信頼度スコアによる正則化を組み合わせます。微視的な視覚、病理組織学、NLPにまたがる4つの多様なベンチマーク上で、4つのプロトタイプ基盤バックボーンにわたる実験により、ProtoTTAが標準的な出力エントロピー最小化よりも頑健性を改善し、さらにプロトタイプ活性における正しい意味的焦点を回復させることを示します。また、新しい解釈可能性指標と、TTAのダイナミクスを説明するための視覚-言語モデル(VLM)評価フレームワークも導入します。その結果、ProtoTTAは人間に整合した意味的焦点を回復し、VLMが評価する推論の質と確実に相関することを確認します。コードは以下で利用可能です: https://github.com/DeepRCL/ProtoTTA。
ProtoTTA:プロトタイプ誘導型テスト時適応
arXiv cs.LG / 2026/4/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- ProtoTTAは、プロトタイプ(解釈可能な中間表現)を用いる深層ネットワークに対する新しいテスト時適応(TTA)フレームワークで、分布シフト下での頑健性を高めることを目的としています。
- ProtoTTAはモデル出力だけに基づくのではなく、中間のプロトタイプ類似度シグナルを活用し、プロトタイプ類似度分布のエントロピーを最小化することで、シフト後のデータでより確信のあるプロトタイプ特異的な活性化を促します。
- 不安定な更新を防ぐために、プロトタイプ活性が信頼できるサンプルのみに更新を行う幾何学的フィルタリングを用い、プロトタイプ重要度の重みとモデル信頼度スコアで更新を正則化します。
- 複数のプロトタイプ・バックボーンと、きめ細かなビジョン、腫瘍病理、NLPを含む多様なベンチマークでの実験により、ProtoTTAは標準的な出力エントロピー最小化より頑健性が改善し、プロトタイプ活性における意味的焦点も回復できることが示されます。
- さらに、解釈可能性のための新しい評価指標と、TTAのダイナミクスを説明するVLM(ビジョン・言語モデル)評価フレームワークも提案され、人間に整合した意味的焦点への再整列と、VLMによる推論品質評価との相関が確認されています。
- コードは提示されたGitHubリポジトリで公開されています。



