手の隠蔽下における固有受容と多接触触覚による、物理的に基づいた3D生成的再構成
arXiv cs.CV / 2026/4/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、固有受容および多接触の触覚信号を用いて、重度の手による隠蔽下でメートルスケールの非可視(両面視)物体を補完するための、マルチモーダルかつ物理的に根拠づけられた3D生成的再構成手法を提案する。
- 物体を、姿勢に応じたカメラ整合の符号付き距離場(SDF)として表現し、Structure-VAEによりコンパクトな構造潜在表現を学習した上で、その空間上で条件付きフローマッチング拡散モデルにより分布をモデル化する。
- 学習は、視覚のみの事前学習段階の後、隠蔽された操作シーンで微調整(finetuning)を行い、可視RGBの証拠、隠蔽/可視性マスク、手の潜在状態、触覚接触情報を条件として用いる。
- 物理的妥当性を高めるために、手と物体の相互貫通(interpenetration)を減らし、接触制約をより適切に満たすための、物理ベースの目的関数と微分可能なデコーダ誘導(decoder-guidance)を導入する。
- シミュレーション実験では、隠蔽補完において視覚のみのベースラインに比べて大幅な改善が示され、さらに実際のヒューマノイドロボットへの転移によって手法が検証される。




