方向性の混乱が、人間と機械の視覚における異なる帰納バイアスをレート・ディストーション幾何学で明らかにする
arXiv cs.CV / 2026/4/24
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、人間と深層視覚モデルが同程度の分類精度を達成しても、誤りの“方向”において系統的に異なること(誤りの頻度ではなく、誰が誰として誤認され、どの方向に誤るか)があると示しています。
- 自然画像のカテゴリ分類タスクに対して12種類の摂動を加え、人間とモデルの応答を対応させて比較し、混同行列の非対称性を定量化した上で、それをレート・ディストーション(RD)枠組みで説明しています。
- RD枠組みでは、幾何学的な3つの指標(傾きβ、曲率κ、効率AUC)を用いることで、精度だけでは見えない帰納バイアスを可視化します。
- 人間は幅広いが弱い非対称性を示す一方、深層視覚モデルはより疎で強い方向性の「崩れ(collapses)」を示すことが分かります。
- ロバスト性の学習は全体の非対称性を減らしますが、人間のような“段階的な幅と強さ”のプロファイルは回復できず、さらにメカニズムに基づくシミュレーションでは、これらの非対称性の構成がRDフロンティアを互いに逆方向へ押し動かし得ることが示唆されます。



