GenePlan: 大規模言語モデルを用いたより優れた一般化PDDLプランの進化的生成

arXiv cs.AI / 2026/3/11

Models & Research

原文を読む →

共有:

要点

GenePlanは、大規模言語モデル支援の進化的アルゴリズムを組み合わせ、PDDLベースの古典計画問題向けのドメイン固有の一般化プランナーを生成する新しいフレームワークです。
一般化計画を最適化問題として定式化し、さまざまな問題インスタンス間でプランの長さを最小化するPythonで解釈可能なプランナーを進化させます。
既存の6つのベンチマークドメインと2つの新規ドメインでの評価で、GenePlanは0.91という高いSATスコアを達成し、最先端のプランナー（SATスコア0.93）に近い性能を示し、チェインオブソートプロンプティングなど他のLLMベース手法（平均SATスコア0.64）を大幅に上回りました。
GenePlanが生成したプランナーは効率的で、新しい問題を迅速に（平均0.49秒）かつコスト効果的に（GPT-4oを用いて１ドメインあたり約1.82ドル）解決します。
本アプローチは、LLMと進化戦略の統合によるAIにおける自動計画の解決策の進展可能性を示しています。

計算機科学 > 人工知能

arXiv:2603.09481 (cs)

[2026年3月10日投稿]

タイトル:GenePlan: 大規模言語モデルを用いた、より良い汎化PDDLプランの進化

著者:Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore

Andrew Murray および他2名の著者による論文「GenePlan: 大規模言語モデルを用いた、より良い汎化PDDLプランの進化」のPDFを表示

PDFを見る HTML（実験的）

要旨:本稿では、GenePlan（GENeralized Evolutionary Planner）という新しい枠組みを提案する。これは、大規模言語モデル（LLM）支援の進化的アルゴリズムを活用し、PDDLで記述された古典的計画問題に対して、領域依存の汎化プランナを生成する。汎化計画を最適化問題として捉えることで、GenePlanは、多様な問題インスタンスにわたってプラン長を最小化する、解釈可能なPythonプランナを反復的に進化させる。既存の6つのベンチマーク領域に加え、新たな2つの領域での実験評価の結果、GenePlanは平均SATスコア0.91を達成し、最先端のプランナの性能（SATスコア0.93）にきわめて近かった。さらに、思考連鎖（CoT）プロンプトなどの他のLLMベースのベースラインに比べて大幅に上回り（平均SATスコア0.64）、生成されたプランナは新しいインスタンスを素早く解き（タスクあたり平均0.49秒）、低コストで実行できた（GPT-4oを用いた場合、領域あたり平均$1.82）。

コメント:
分野:	人工知能（cs.AI）
引用:	arXiv:2603.09481 [cs.AI]
	（このバージョンについては、または arXiv:2603.09481v1 [cs.AI]）
	https://doi.org/10.48550/arXiv.2603.09481 詳細を学ぶためにフォーカス DataCite経由のarXiv発行DOI

投稿履歴

差出人: Andrew Murray [メールを見る]
[v1] 2026年3月10日(火) 10:32:05 UTC (648 KB)

フルテキストリンク:

論文へのアクセス:

論文「GenePlan: 大規模言語モデルを用いた、より良い汎化PDDLプランの進化」（Andrew Murrayおよび他2名の著者）のPDFを表示

PDFを見る
HTML（実験的）
TeXソース

ライセンスを表示

現在のブラウズ文脈:

cs.AI

< 前へ | 次へ >

新着 | 最近 | 2026-03

ブラウズを次に切り替え:

参考文献 & 引用

BibTeX引用のエクスポート読み込み中...

BibTeX形式の引用

提供データ:

ブックマーク

書誌ツール

書誌および引用ツール

Bibliographic Explorer トグル

Bibliographic Explorer (Explorerとは？)

Connected Papers トグル

Connected Papers (Connected Papersとは？)

Litmaps トグル

Litmaps (Litmapsとは？)

scite.ai トグル

scite Smart Citations (Smart Citationsとは？)

コード、データ、メディア

この論文に関連付けられたコード、データ、メディア

alphaXiv トグル

alphaXiv (alphaXivとは？)

コードへのリンクトグル

論文向け CatalyzeX コードファインダー (CatalyzeXとは？)

DagsHub トグル

DagsHub (DagsHubとは？)

GotitPub トグル

Gotit.pub (GotitPubとは何ですか？)

Huggingface トグル

Hugging Face (Huggingfaceとは何ですか？)

コードへのリンクトグル

Papers with Code (Papers with Codeとは何ですか？)

ScienceCast トグル

ScienceCast (ScienceCastとは何ですか？)

デモ

Replicate トグル

Replicate (Replicateとは何ですか？)

Spaces トグル

Hugging Face Spaces (Spacesとは何ですか？)

Spaces トグル

TXYZ.AI (TXYZ.AIとは何ですか？)

レコメンダーおよび検索ツール

Influence Flower へのリンク

Influence Flower (Influence Flowerとは何ですか？)

Core レコメンダートグル

CORE レコメンダー (COREとは何ですか？)

著者
掲載先
所属機関
トピック

arXivLabsについて

arXivLabs：コミュニティの協力者とともに行う実験的プロジェクト

arXivLabsは、協力者が当社のウェブサイト上で直接、新しいarXivの機能を開発し、共有できるようにするためのフレームワークです。

arXivLabsに携わる個人および組織の双方が、オープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、そしてそれを尊重してきました。arXivはこれらの価値観に取り組んでおり、それらを遵守するパートナーとのみ連携します。

arXivのコミュニティに付加価値をもたらすプロジェクトのアイデアはありますか？ arXivLabsについて詳しく知る。

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

LLMの合成データ生成は臨床テキストマイニングに役立つか？

Dev.to

ローカルAI時代の夜明け：iPhone 17 ProからNVIDIA RTXの未来へ

Dev.to

GenePlan: 大規模言語モデルを用いたより優れた一般化PDDLプランの進化的生成

要点

計算機科学 > 人工知能

タイトル:GenePlan: 大規模言語モデルを用いた、より良い汎化PDDLプランの進化

投稿履歴

論文へのアクセス:

参考文献 & 引用

BibTeX形式の引用

ブックマーク

書誌および引用ツール

この論文に関連付けられたコード、データ、メディア

デモ

レコメンダーおよび検索ツール

arXivLabs：コミュニティの協力者とともに行う実験的プロジェクト

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

LLMの合成データ生成は臨床テキストマイニングに役立つか？

ローカルAI時代の夜明け：iPhone 17 ProからNVIDIA RTXの未来へ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer