経験からスキルへ:再利用可能な戦略学習によるマルチエージェント・生成エンジン最適化

arXiv cs.AI / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • この論文は、既存の生成エンジン最適化(GEO)が各クエリを個別に最適化するだけで、タスクやエンジンをまたいで有効な最適化戦略を再利用・転移できないと指摘しています。
  • 著者らはGEOを「戦略学習」として捉え直し、共同の計画・編集・忠実度を考慮した評価を用いて、再利用可能なエンジン固有の「最適化スキル」を段階的に抽出するマルチエージェント枠組みMAGEOを提案します。
  • 変更点の因果帰属を含む制御された評価のために、Twin Branch Evaluation Protocolと、意味的な可視性と帰属の正確さを統合するDSV-CFメトリクスを導入しています。
  • さらに、実世界のクエリに基づく複数シナリオ・複数エンジンのベンチマークMSME-GEO-Benchを公開し、3つの主要エンジンに対してMAGEOがヒューリスティック基準より可視性と引用の忠実度の両面で大きく上回ることを示します。
  • アブレーション分析では、エンジン固有の嗜好モデリングと戦略の再利用が性能向上の中核であることが明らかになり、信頼性の高いGEOのためのスケーラブルな学習駆動パラダイムを示唆しています。

概要: 生成エンジン(GE)は、ランキングされたリンクを引用に根ざした回答に置き換えることで情報アクセスを再構築しつつあります。しかし、現在の生成エンジン最適化(GEO)手法は各インスタンスを個別に最適化するにとどまっており、タスクやエンジン間で有効な戦略を蓄積したり移転したりできません。私たちはGEOを戦略学習の問題として捉え直し、MAGEOを提案します。MAGEOはマルチエージェントの枠組みであり、協調的な計画・編集・忠実度を意識した評価が実行層として機能します。さらに、有効性が検証された編集パターンを、再利用可能なエンジン固有の最適化スキルへと段階的に蒸留していきます。制御された評価を可能にするために、コンテンツ編集に対する因果的帰属を行うためのTwin Branch Evaluation Protocolを導入し、また、意味的な可視性と帰属の正確さを統一する二軸メトリクスであるDSV-CFを提案します。加えて、実世界のクエリに基づく、マルチシナリオ・マルチエンジンのベンチマークであるMSME-GEO-Benchを公開します。主要3つのエンジンに対する実験により、MAGEOは可視性と引用の忠実度の両面で、ヒューリスティックなベースラインを大きく上回ることが示されます。アブレーション結果では、エンジン固有の嗜好(パレート)モデリングと戦略の再利用が、これらの改善の中核であることが確認されます。これにより、信頼できるGEOのための、スケーラブルな学習駆動パラダイムが示唆されます。コードは https://github.com/Wu-beining/MAGEO で利用可能です