ALAS：非同期パスウェイのストリーム分離による適応的ロングホライズン行動合成

arXiv cs.RO / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

ALASは、継続的な計画と長時間の実行を必要とするロングホライズンのヒューマンシーンインタラクション（HSI）タスクに対して、複数環境へまたがる横断的な学習を改善するための枠組みです。
本手法は、事前学習したサブタスクを連結するスキル・チェイニングに依存する従来のやり方の弱点を避けるために、生物学的に着想を得たデュアルストリーム分離を用います。
ALASでは、環境学習モジュールが空間理解（物体の機能、空間的な関係、シーンのセマンティクス）を担い、環境と自己（自己状態）の分離によって転移性を高めます。
さらに、自己状態情報から運動パターンを独立に符号化するスキル学習モジュールを備え、運動パターンの独立エンコーディングによりスキル間の転移を可能にします。
複数のロングホライズンHSIタスクでの実験では、ALASが既存手法に比べて平均サブタスク成功率を23%改善し、平均実行効率を29%改善したことが示されています。

Abstract

人間-シーンインタラクション（HSI）における長期ホライズン（LH）タスクは、最終目標を達成するために、連続的な計画、逐次的な意思決定、そしてドメインをまたいだ長時間の実行を必要とする、複雑な多段階タスクである。しかし、既存の手法は、事前学習済みのサブタスクを連結することでスキル連鎖に大きく依存しており、環境の観測と自己状態が密に結合されているため、新しい環境の組み合わせやスキルの組み合わせへ一般化する能力を欠き、ドメインをまたいでさまざまなLHタスクを完了できない。この問題を解決するため、本論文では、生物学的に着想を得たデュアルストリームの分離により、LHタスクのためのクロスドメイン学習フレームワークであるALASを提案する。脳の「where-what」デュアル経路メカニズムに触発されて、ALASは2つの中核モジュールから構成される。 i) 空間理解のための環境学習モジュールであり、物体の機能、空間関係、シーンの意味論を捉え、環境-自己の完全な分離を通じてクロスドメイン転移を実現する。 ii) タスク実行のためのスキル学習モジュールであり、関節の自由度やモータパターンを含む自己状態情報を処理し、独立したモータパターンの符号化によってスキル間転移を可能にする。 HSIのシーンにおけるさまざまなLHタスクに対して大規模な実験を行った。既存手法と比較して、ALASはサブタスクの成功率において平均23\%の改善、実行効率において平均29\%の改善を達成できる。