要約: 自然言語による説明は、ブラックボックスモデルを説明するための本質的に人間が理解しやすい手段を提供し、放射線科医が診断をテキストレポートで伝える方法を密接に反映します。
ほとんどの研究は、説明生成プロセスを説明で注釈されたデータセットを用いて明示的に監視します。
したがって、もっともらしくても、生成された説明はモデルの推論に忠実ではありません。
本研究では、WeNLEXを提案します。これは、多ラベル胸部X線分類のための自然言語説明生成のための弱教師付きモデルです。
忠実性は、対応する自然言語説明から生成された画像を、ブラックボックスモデルの特徴空間で元の画像と一致させることで保証されます。
妥当性は、臨床医が注釈した説明の小規模データベースとの分布整合性を通じて維持されます。
我々は、忠実性、模倣可能性、多様性、妥当性を評価する複数の指標による広範な検証を通じて、WeNLEXが診断ごとに正解データの説明をわずか5件からでも、忠実で妥当な説明を生成できることを実証します。
さらに、WeNLEXはポストホックとモデル内設定の両方で動作できます。
後者、すなわち多ラベル分類器がネットワーク全体とともに訓練される場合、WeNLEXは単独の分類器のAUCを2.21%向上させ、トレーニングプロセスに解釈性を追加することが下流のタスク性能を実際に向上させることを示しています。
さらに、データベースを変更するだけで、WeNLEXの説明は任意のターゲットオーディエンスに適応可能であり、この柔軟性を示すために、非医療従事者向けに説明を簡略化したWeNLEXの一般向け版を訓練して紹介します。
返却形式: {"translated": "翻訳されたHTML"}
WeNLEX: 弱教師付き自然言語説明による多ラベル胸部X線分類
arXiv cs.CV / 2026/3/20
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- WeNLEXは、多ラベル胸部X線分類の自然言語説明を生成する弱教師付きアプローチを導入し、大量の注釈付き説明データセットの必要性を削減します。
- 説明の信頼性は、説明から画像を生成し、それをブラックボックスモデルの特徴空間で元の画像と照合することで担保されます。
- 妥当性は、臨床医が注釈した説明の小規模データベースとの分布整合性を保つことで確保し、診断ごとにわずか5件の正解データ例でも説得力のある説明を可能にします。
- 本手法はポストホック設定とインモデル設定の両方で機能し、共同訓練された場合、分類器のAUCを2.21%向上させ、解釈性が下流の性能を向上させることを示します。
- 説明は、説明データベースを変更することで異なる聴衆に適応でき、非医療従事者向けの一般向け版を用いたデモで示されています。