GenePlan: 大規模言語モデルを用いたより優れた一般化PDDLプランの進化的生成

arXiv cs.AI / 2026/3/11

Models & Research

要点

  • GenePlanは、大規模言語モデル支援の進化的アルゴリズムを組み合わせ、PDDLベースの古典計画問題向けのドメイン固有の一般化プランナーを生成する新しいフレームワークです。
  • 一般化計画を最適化問題として定式化し、さまざまな問題インスタンス間でプランの長さを最小化するPythonで解釈可能なプランナーを進化させます。
  • 既存の6つのベンチマークドメインと2つの新規ドメインでの評価で、GenePlanは0.91という高いSATスコアを達成し、最先端のプランナー(SATスコア0.93)に近い性能を示し、チェインオブソートプロンプティングなど他のLLMベース手法(平均SATスコア0.64)を大幅に上回りました。
  • GenePlanが生成したプランナーは効率的で、新しい問題を迅速に(平均0.49秒)かつコスト効果的に(GPT-4oを用いて1ドメインあたり約1.82ドル)解決します。
  • 本アプローチは、LLMと進化戦略の統合によるAIにおける自動計画の解決策の進展可能性を示しています。

計算機科学 > 人工知能

arXiv:2603.09481 (cs)
[2026年3月10日 投稿]

タイトル:GenePlan: 大規模言語モデルを用いた、より良い汎化PDDLプランの進化

Andrew Murray および他2名の著者による論文「GenePlan: 大規模言語モデルを用いた、より良い汎化PDDLプランの進化」のPDFを表示
PDFを見る HTML(実験的)
要旨:本稿では、GenePlan(GENeralized Evolutionary Planner)という新しい枠組みを提案する。これは、大規模言語モデル(LLM)支援の進化的アルゴリズムを活用し、PDDLで記述された古典的計画問題に対して、領域依存の汎化プランナを生成する。汎化計画を最適化問題として捉えることで、GenePlanは、多様な問題インスタンスにわたってプラン長を最小化する、解釈可能なPythonプランナを反復的に進化させる。既存の6つのベンチマーク領域に加え、新たな2つの領域での実験評価の結果、GenePlanは平均SATスコア0.91を達成し、最先端のプランナの性能(SATスコア0.93)にきわめて近かった。さらに、思考連鎖(CoT)プロンプトなどの他のLLMベースのベースラインに比べて大幅に上回り(平均SATスコア0.64)、生成されたプランナは新しいインスタンスを素早く解き(タスクあたり平均0.49秒)、低コストで実行できた(GPT-4oを用いた場合、領域あたり平均$1.82)。
コメント:
分野: 人工知能(cs.AI)
引用: arXiv:2603.09481 [cs.AI]
  (このバージョンについては、または arXiv:2603.09481v1 [cs.AI]
  https://doi.org/10.48550/arXiv.2603.09481
詳細を学ぶためにフォーカス
DataCite経由のarXiv発行DOI

投稿履歴

差出人: Andrew Murray [メールを見る]
[v1] 2026年3月10日(火) 10:32:05 UTC (648 KB)
フルテキストリンク:

論文へのアクセス:

現在のブラウズ文脈:
cs.AI
ブラウズを次に切り替え:
cs

参考文献 & 引用

BibTeX引用のエクスポート 読み込み中...

BibTeX形式の引用

×
提供データ:

ブックマーク

BibSonomyロゴ Redditロゴ
書誌ツール

書誌および引用ツール

Bibliographic Explorer トグル
Bibliographic Explorer (Explorerとは?)
Connected Papers トグル
Connected Papers (Connected Papersとは?)
Litmaps トグル
Litmaps (Litmapsとは?)
scite.ai トグル
scite Smart Citations (Smart Citationsとは?)
コード、データ、メディア

この論文に関連付けられたコード、データ、メディア

alphaXiv トグル
alphaXiv (alphaXivとは?)
コードへのリンク トグル
論文向け CatalyzeX コードファインダー (CatalyzeXとは?)
DagsHub トグル
DagsHub (DagsHubとは?)
GotitPub トグル
Huggingface トグル
コードへのリンク トグル
ScienceCast トグル
デモ

デモ

Replicate トグル
Spaces トグル
Hugging Face Spaces (Spacesとは何ですか?)
Spaces トグル
関連論文

レコメンダーおよび検索ツール

Influence Flower へのリンク
Core レコメンダー トグル
CORE レコメンダー (COREとは何ですか?)
arXivLabsについて

arXivLabs:コミュニティの協力者とともに行う実験的プロジェクト

arXivLabsは、協力者が当社のウェブサイト上で直接、新しいarXivの機能を開発し、共有できるようにするためのフレームワークです。

arXivLabsに携わる個人および組織の双方が、オープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、そしてそれを尊重してきました。arXivはこれらの価値観に取り組んでおり、それらを遵守するパートナーとのみ連携します。

arXivのコミュニティに付加価値をもたらすプロジェクトのアイデアはありますか? arXivLabsについて詳しく知る