相互作用を通じた改善:CMA-ES-IGによる行動表現空間の探索

arXiv cs.AI / 2026/3/11

Ideas & Deep AnalysisModels & Research

要点

  • 本論文は、ユーザー体験を学習プロセスに取り入れてロボットの行動の好み学習を改善するために設計されたアルゴリズムCMA-ES-IGを紹介する。
  • CMA-ES-IGは、知覚的に異なり情報量の多い軌道をユーザーに提示しランク付けさせることで、従来手法に比べてユーザーの相互作用と満足度を向上させる。
  • 高次元の好み空間に対しても計算可能性を維持しつつ規模拡大が可能であり、ノイズの多いまたは一貫性のないユーザーフィードバックに対しても頑健である。
  • シミュレーション研究および実際のロボット実験の両方でCMA-ES-IGの優位性が検証されており、生成されたロボット行動に対してユーザーも好意的である。
  • 本アルゴリズムは、最終成果の最適化とランキング過程におけるユーザーの肯定的な関与のバランスをとることで、現行の好み学習技術の主要な欠点を解決している。

コンピュータサイエンス > ロボティクス

arXiv:2603.09011 (cs)
[2026年3月9日 投稿]

題目:Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

Nathaniel Dennler 氏と他5名の著者による論文 Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG の PDF を表示
PDFを表示 HTML(実験的)
要旨:人間と相互作用するロボットは、人間中心の環境で効果的に動作するために、個々の利用者の嗜好に適応する必要があります。非専門家ユーザの嗜好を学習するための直感的で効果的な手法は、例えば軌道、ジェスチャー、声などのロボット行動のランキングを通じて行うことです。既存の手法は主として、サンプル効率や最終的な嗜好推定の精度といった嗜好学習の結果を最適化するクエリの生成に焦点を当てています。しかし、結果に焦点を当てるだけでは、ランキングを提示する過程における重要な利用者の期待が見落とされ、そのことがロボットシステムの利用開始を妨げる可能性があります。本研究では、共分散行列適応進化戦略に情報利得(CMA-ES-IG)を組み合わせたアルゴリズムを提案します。CMA-ES-IG は、利用者がランキングするために知覚的に明確で情報量の多い軌道を提案することで、嗜好学習の過程に利用者体験に関する考慮を明示的に取り込みます。これらの利点を、シミュレーションによる研究と実ロボット実験の両方によって示します。CMA-ES-IG は最先端の代替手法と比べて、(1) 高次元の嗜好空間により効果的にスケールし、(2) 高次元問題に対して計算上の実行可能性を維持し、(3) ノイズのある、または一貫性のない利用者フィードバックに対して頑健であり、(4) 非専門家の利用者によって、自分が好むロボット行動を特定する点で優先されます。このプロジェクトのコードは この http URL で公開されています
コメント:
分野: Robotics (cs.RO); 人工知能 (cs.AI); ヒューマンコンピュータインタラクション (cs.HC)
引用: arXiv:2603.09011 [cs.RO]
  (または この版の場合 arXiv:2603.09011v1 [cs.RO])
  https://doi.org/10.48550/arXiv.2603.09011
さらに詳しく学ぶためにフォーカス
DataCite 経由で発行された arXiv DOI

投稿履歴

投稿者: Nathaniel Dennler [メールを表示]
[v1] 2026年3月9日(月) 23:00:42 UTC (7,021 KB)
全文リンク:

論文へのアクセス:

現在の閲覧コンテキスト:
cs.RO
< prev   |   next >
ブラウズ方法を変更:

参考文献 & 引用

BibTeX の引用をエクスポート 読み込み中...

BibTeX 形式の引用

×
提供データ:

ブックマーク

BibSonomy ロゴ Reddit ロゴ
書誌ツール

書誌および引用ツール

書誌エクスプローラーの切り替え
書誌エクスプローラー (エクスプローラーとは?)
Connected Papers の切り替え
Connected Papers (Connected Papers とは?)
Litmaps の切り替え
Litmaps (Litmaps とは?)
scite.ai の切り替え
scite Smart Citations (Smart Citations とは?)
コード、データ、メディア

この論文に関連するコード、データ、メディア

alphaXiv の切り替え
alphaXiv (alphaXiv とは?)
返却形式: {"translated": "翻訳されたHTML"}
コードの切り替えへのリンク
論文向けCatalyzeXコードファインダー (CatalyzeXとは?)
DagsHubの切り替え
DagsHub (DagsHubとは?)
GotitPubの切り替え
Gotit.pub (GotitPubとは?)
Huggingfaceの切り替え
Hugging Face (Huggingfaceとは?)
コードの切り替えへのリンク
Papers with Code (Papers with Codeとは?)
ScienceCastの切り替え
ScienceCast (ScienceCastとは?)
デモ

デモ

Replicateの切り替え
Replicate (Replicateとは?)
Spacesの切り替え
Hugging Face Spaces (Spacesとは?)
Spacesの切り替え
TXYZ.AI (TXYZ.AIとは?)
関連論文

レコメンダーおよび検索ツール

インフルエンス・フラワーへのリンク
Influence Flower (Influence Flowerとは?)
Core recommender トグル
CORE Recommender (CORE とは?)
About arXivLabs

arXivLabs:コミュニティの協力者とともに行う実験的プロジェクト

arXivLabs は、協力者が当社のウェブサイト上で新しい arXiv の機能を直接開発し、共有できるようにするためのフレームワークです。

arXivLabs と連携して取り組む個人および組織は、オープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、それを尊重してきました。arXiv はこれらの価値観にコミットしており、それらを遵守するパートナーとのみ連携します。

arXiv のコミュニティにとって価値のあるプロジェクトのアイデアはありますか? arXivLabs についてもっと知る