CWCD: Category-Wise Contrastive Decoding for Structured Medical Report Generation
arXiv cs.AI / 4/14/2026
📰 NewsIdeas & Deep AnalysisModels & Research
Key Points
- この論文は、胸部X線の放射線レポート生成で視覚トークンへの注意が生成後半で弱まり、言語の事前分布に依存して誤った病変の共起(spurious co-occurrence)が起きうる点を問題提起している。
- それを改善するために、Category-Wise Contrastive Decoding(CWCD)というモジュール型フレームワークを提案し、カテゴリ別パラメータ化とカテゴリ別の視覚プロンプトを用いて「正常」と「マスク済み」X線を対比させながらカテゴリごとのレポートを生成する。
- 実験では、CWCDがベースラインを臨床的有効性と自然言語生成の両方の指標で一貫して上回ることが示されている。
- アブレーション研究により、提案手法の各構成要素が性能にどの程度寄与するかも検証している。
Related Articles

Don't forget, there is more than forgetting: new metrics for Continual Learning
Dev.to

Microsoft MAI-Image-2-Efficient Review 2026: The AI Image Model Built for Production Scale
Dev.to
Bit of a strange question?
Reddit r/artificial

One URL for Your AI Agent: HTML, JSON, Markdown, and an A2A Card
Dev.to

One URL for Your AI Agent: HTML, JSON, Markdown, and an A2A Card
Dev.to