QualiaNet:推論の前に体験を行うネットワーク
arXiv cs.CV / 2026/4/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、人間の3D視覚処理を模した2段階の計算フレームワークを提案し、注視に相対したステレオの経験(体験)を作る「Experience Module」と、その経験を解釈して3D特性を推定する「Inference Module」に分けます。
- ステレオ視覚の体験が距離情報を直接は与えない一方で、視覚的なスケールの推論には影響するという点を、提案手法の考え方として位置づけています。
- Inference Module は、自然なシーン統計として「近い対象ほど鮮明な視差勾配が生じ、遠い対象ほど平坦に見えやすい」性質を利用し、明示的な深度手がかりがなくても距離推定を可能にするとしています。
- QualiaNetでは、人間のステレオ経験に近い視差マップを CNN に入力し、距離を推定するよう学習させることで、「視差勾配だけから距離を回復できる」ことを検証しています。
- 全体として、経験(体験)を先に扱い、その後に推論するアーキテクチャが、主に視差勾配パターンに基づいて距離や3D推定を行う有力な仕組みになり得ることを示しています。



