CheXthought:胸部X線診断に向けた臨床チェーン・オブ・ソート推論と視覚的注意を収録するグローバルなマルチモーダルデータセット
arXiv cs.AI / 2026/4/30
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文では、CheXthoughtというグローバルなマルチモーダル臨床データセットを提案しており、71か国・501名の放射線科医が読影した50,312件の胸部X線(複数読影)から、チェーン・オブ・ソート推論トレース103,592件と同期した視覚的注意アノテーション約6,609,082件を収録しています。
- 著者らは、CheXthoughtの推論を用いるモデルが、既存のビジョン・ランゲージモデルのチェーン・オブ・ソート手法よりも、事実精度と空間的グラウンディングの面で優れていると報告しています。
- 推論時に視覚的注意をヒントとして組み込むことで、見落とした所見を回復でき、ハルシネーションを減らせると示されています。
- CheXthoughtデータで学習したモデルは、病理分類、視覚的忠実性、一時的推論、そして不確実性の伝達がより強くなるだけでなく、画像からケースの難しさや不確実性、モデル信頼性をめぐる人間同士・人間—AIの不一致を予測できるとされています。
- 総じてCheXthoughtは、臨床推論におけるマルチモーダルなビジョン・ランゲージモデルをより透明で解釈可能に進めるためのリソースとして位置づけられています。



