エネルギーシステムにおける流体の流れ予測のためのマルチモーダル・ビジョン・トランスフォーマーに基づくモデリング・フレームワーク

arXiv cs.AI / 2026/4/6

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、エネルギーシステムにおける流体の流れを予測するために、トランスフォーマー型の階層的ビジョン・トランスフォーマー・フレームワーク(SwinV2-UNet)を提案し、非線形・多尺度・多物理問題に対して従来のCFDが高コストであることを狙いとしている。
  • これは、データのモダリティと時間増分の両方を符号化する補助トークンを用いたマルチモーダル学習の枠組みにより、モデルが複数の忠実度(マルチフィデリティ)のシミュレーションデータを取り込めるようにする。
  • 実験は、往復動エンジンに関連する高圧ガス噴射に焦点を当て、社内で行ったCFDに基づき、窒素中へのアルゴン・ジェット噴射から作成したマルチモーダル・データセット上で、別々にモデルを学習する。
  • 本フレームワークは、時空間ロールアウト(自己回帰的な将来の流れ予測)および特徴変換(限られた観測から未観測の場・視点を推定)により評価される。
  • 結果として、データ駆動型モデルは異なる格子解像度およびモダリティにまたがって一般化でき、流れの進展を正確に予測するとともに、欠落した流れ場情報を再構成できることが示される。

要旨: エネルギーシステムにおける複雑な流体の流れの計算流体力学(CFD)シミュレーションは、強い非線形性とマルチスケール・マルチフィジックス相互作用のため、計算コストが非常に高くつきます。本研究では、流体の流れを予測するためのトランスフォーマーに基づくモデリングの枠組みを提示し、往復動エンジンに関連する高圧ガス噴射現象に対してその有効性を示します。本手法は階層型ビジョントランスフォーマー(SwinV2-UNet)アーキテクチャを用い、複数の忠実度(multi-fidelity)シミュレーションから得られたマルチモーダルな流れデータセットを処理します。モデルのアーキテクチャは、データのモダリティと時間増分を明示的に符号化する補助トークンによって条件付けされます。モデル性能は、2つの異なるタスクで評価します: (1) 時空間ロールアウト。ここではモデルが自己回帰的に将来時刻の流れ状態を予測します。 (2) 特徴変換。ここではモデルが観測された場/ビューから、未観測の場/ビューを推論します。本研究では、当社内のCFDシミュレーションによって生成したマルチモーダルデータセットに対して別々のモデルを学習します。対象は、窒素環境にアルゴン噴流を注入するケースであり、複数の格子解像度、乱流モデル、および状態方程式を含みます。その結果得られるデータ駆動型モデルは、解像度およびモダリティをまたいだ一般化を学習し、流れの時間発展を正確に予測するとともに、限られたビューから欠落した流れ場の情報を再構成できることが示されました。本研究は、大規模なビジョントランスフォーマーモデルを、複雑な流体フロー系の予測モデリングを前進させるために適応できることを示しています。