要旨: ライブ未来予測(Live future prediction)とは、現実世界の出来事が起こる前にそれらについて予測を行うという課題を指します。この課題は、大規模言語モデルに基づくエージェントシステムを用いて研究されることが増えており、現実世界から継続的に学習できるエージェントを構築するうえで重要です。インタラクティブな環境がしばしばエージェントの進展を促してきたのと同様に、ライブ未来予測の発展は、それを学習環境として捉えることを自然に動機づけます。先行研究では、未来予測をいくつかの異なる側面から検討してきましたが、一般にそれを統一された学習環境としては位置づけていません。この課題は、回答の漏洩を防ぎつつ、多様な現実世界の出来事に根ざした大量の予測問題を提供できるため、学習に魅力があります。ライブ未来予測の利点を活かすために、予測、結果の実現、パラメータ更新の間の学習ループを閉じる、ライブなエージェント型強化学習環境であるFutureWorldを提案します。本環境では、3つのオープンソースの基盤モデルを取り、連続する複数日間で学習します。その結果、学習が有効であることが示されます。さらに、環境に基づいた毎日のベンチマークを構築し、現在のエージェントシステムに対する性能のベースラインを確立するために、そのベンチマーク上でいくつかの最先端エージェントを評価します。
FutureWorld:実世界の結果報酬で予測エージェントを訓練するためのライブ環境
arXiv cs.AI / 2026/4/30
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本論文は、実世界の出来事が起きる前に予測する「ライブ・フューチャー・プレディクション」を対象とした、エージェント型強化学習環境「FutureWorld」を提案する。
- FutureWorldは、予測を行い、実世界の結果を観測し、モデルのパラメータを更新することで学習ループを閉じ、継続的学習を可能にする設計になっている。
- 著者らは環境内で、オープンソースのベースモデル3つを連続する日々にわたって学習させ、提案手法の有効性を示している。
- さらに、FutureWorldに基づく日次ベンチマークを構築し、複数の最先端エージェントを評価して、現在のエージェントに対する性能ベースラインを提示する。
- 本研究は、ライブ・フューチャー・プレディクションを統一された学習環境として位置付け、多様な実世界に根ざした問いを提供しつつ、答えの漏洩リスクを抑えることを狙っている。



