大規模言語モデルは制約下で推論し、最適化できるのか?
arXiv cs.AI / 2026/3/25
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、大規模言語モデルが、実際の物理・運用上の制約を持つ Optimal Power Flow(OPF)問題に対して、推論および制約付き最適化を行えるかどうかを評価する。
- 複数の制約解決に必要な中核スキル(構造化された入力処理、算術、推論、制約付き最適化)をテストする、厳密なベンチマークを提案する。
- 結果として、最先端のLLMは大多数のタスクで失敗し、推論に特化したLLMでさえ、最も難しい制約中心の設定では大きく苦戦することが示される。
- 著者らは、制約下で構造化された推論を実行するLLMの能力における重要なギャップを特定し、本ベンチマークを、実際の電力系統最適化を目指す将来のLLMアシスタントを評価するためのテストフィールドとして位置づける。
広告




