グラフベースの階層型強化学習による高性能熱力学サイクルの自動共同設計
arXiv cs.LG / 2026/4/16
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、サイクル構造を、文法制約付きのノードとエッジで表現することで、熱力学サイクルの共同設計を自動化するための、グラフベースの階層型強化学習フレームワークを提案する。
- グラフからの安定したデコードを可能にし、最適化の過程でグローバルパラメータを共同で解決するために、深層学習による熱物理サロゲートを用いる。
- マネージャ—ワーカ型の強化学習設定により探索を行う。高レベルのマネージャは構造の進化を探索し、候補となる構成を提案する。一方、低レベルのワーカはパラメータを最適化し、性能に基づく報酬を返す。
- ヒートポンプおよびヒートエンジンのケーススタディでは、本手法は古典的な構成を再現するとともに、18件の新規ヒートポンプサイクルと21件の新規ヒートエンジンサイクルを発見する。
- 報告された新規設計は、古典的ベースラインに対してヒートポンプで4.6%、ヒートエンジンで133.3%の性能向上を示しており、専門家主導の設計よりも効率とスケーラビリティが改善されていることを示唆する。




