FixationFormer: Direct Utilization of Expert Gaze Trajectories for Chest X-Ray Classification
arXiv cs.CV / 3/25/2026
📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- FixationFormerは、放射線科医の注視(eye gaze)軌跡を時系列のトークン列として表現し、CNNよりもTransformerに適した形で医用画像分類へ直接統合する枠組みを提案しています。
- 注視データは時系列的に高密度である一方、空間的に疎でノイジー、専門家間でばらつくため、画像特徴と注視トークン列を共同で学習し、cross-attentionによりこの課題に対処します。
- 3つの公開ベンチマークの胸部X線データセットで評価し、胸部X線分類において最先端(SOTA)の性能を示したと報告しています。
- 注視をヒートマップのような縮約表現ではなく「シーケンス」として保持することで、より直接的できめ細かな診断的手がかりの取り込みが可能になる点が強調されています。
Related Articles
The Security Gap in MCP Tool Servers (And What I Built to Fix It)
Dev.to
Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to
I made a new programming language to get better coding with less tokens.
Dev.to
RSA Conference 2026: The Week Vibe Coding Security Became Impossible to Ignore
Dev.to

Adversarial AI framework reveals mechanisms behind impaired consciousness and a potential therapy
Reddit r/artificial