要旨: 能動的知覚は、私たち人間が、本質的に部分的にしか観測できない環境における不確実性に対処するためを可能にする基本的な技能である。情報が疎で局所的である触覚などの感覚においては、能動的知覚がとりわけ重要になる。近年、能動的知覚はロボティクスにおける重要な研究領域として注目されている。しかし、現在の手法はしばしば特定のタスクに結びついている、あるいは強い仮定に依存しているため、その汎用性が制限されている。本研究はこのギャップを埋めるために、強化学習(RL)を活用してさまざまな能動的知覚問題に対処する新しい枠組みである APPLE(Active Perception Policy Learning)を提案する。APPLEは、統一された最適化目標のもとでトランスフォーマーに基づく知覚モジュールと意思決定ポリシーを共同で学習し、情報を能動的に収集する方法を獲得する。設計上、APPLEは特定のタスクに限定されず、原理的には幅広い能動的知覚問題に適用できる。Tactile MNISTベンチマークの触覚探索問題を含む、異なるタスクに対してAPPLEの2つのバリアントを評価する。実験の結果、回帰タスクおよび分類タスクの双方で高い精度が得られることが示され、APPLEの有効性が実証された。これらの知見は、ロボティクスにおける能動的知覚を発展させるための、汎用的で一般性の高い枠組みとしてのAPPLEの可能性を裏づける。プロジェクトページ: https://timschneider42.github.io/apple
Apple:強化学習による一般化アクティブ知覚へのアプローチ
arXiv cs.RO / 2026/4/9
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、部分的に観測可能な環境における一般化可能なアクティブ知覚のための強化学習フレームワークであるAPPLE(Active Perception Policy Learning)を紹介しており、疎な触覚センシングのシナリオも含みます。
- APPLEは、情報を能動的に収集する方法を学習することを目的とした統一された最適化目標により、トランスフォーマ型の知覚モジュールと意思決定ポリシーを共同で学習します。
- 本フレームワークはタスク非依存で設計されており、従来のアクティブ知覚手法がしばしば特定のタスクに結び付いていたり、強い仮定に依存していたりするという重要な限界に対処します。
- Tactile MNISTベンチマークを用いた触覚探索を含む複数のタスクにおいて、APPLEの2つのバリアントを用いた実験では、回帰と分類の両方で高い性能が示されます。


