人間の視線を用いた主観的な都市認知のモデリング
arXiv cs.CV / 2026/5/4
📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- 本論文は、従来の都市認知の計算手法が、主観的な判断の形成に関わる人間の知覚(視線)プロセスをほとんど考慮せず、ストリートビュー画像から直接認知をモデル化しがちだというギャップを指摘している。
- ストリートビュー画像と同期した眼球運動計測データ、さらに個人の認知ラベルを組み合わせた都市認知データセット「Place Pulse-Gaze」を提案している。
- 「Gaze-Guided Urban Perception Framework」では、視線のみのモデリング、視線と明示的なセマンティックなシーン表現の融合、視線と暗黙的でより豊かな視覚表現の融合の3設定を体系的に検証している。
- 実験では、視線単独でも主観的な都市認知の予測に有用な情報を含むことが示され、視線をシーン表現と統合することで、セマンティック表現の場合もより豊かな視覚表現の場合も予測精度が向上することが分かっている。
- 全体として、人間の知覚プロセスを都市のシーン理解に取り込む重要性を強調し、視線に導かれたマルチモーダルな都市コンピューティングへの方向性を示している。

