Reasoning-Driven Anomaly Detection and Localization with Image-Level Supervision
arXiv cs.CV / 3/31/2026
💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- 提案手法ReALは、MLLMの推論過程から異常関連トークンを抽出し、そのattention応答を集約して画素レベルの異常マップを生成する枠組みを示している。
- Consistency-Guided Reasoning Optimization (CGRO) は強化学習で推論トークンと視覚attentionの整合を高め、より首尾一貫した推論と局在精度の向上を狙っている。
- 画素レベルの教師や外部の補助視覚モジュールに頼らず、画像レベルの教師のみで異常検出・局在・解釈可能な推論を行えることを主張している。
- 4つの公開ベンチマークで、検出・局在・解釈性が大幅に改善され、画素レベル教師ありで学習したMLLMベース手法に競合する性能を示したとしている。
💡 Insights using this article
This article is featured in our daily AI news digest — key takeaways and action items at a glance.
Related Articles

Black Hat Asia
AI Business
[D] How does distributed proof of work computing handle the coordination needs of neural network training?
Reddit r/MachineLearning

Claude Code's Entire Source Code Was Just Leaked via npm Source Maps — Here's What's Inside
Dev.to

BYOK is not just a pricing model: why it changes AI product trust
Dev.to

AI Citation Registries and Identity Persistence Across Records
Dev.to