OMNIFLOW: 一般化された科学的推論のための物理に基づくマルチモーダルエージェント

arXiv cs.LG / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

OMNIFLOW は凍結済みの多模態 LLM を基本的な物理法則に接地させ、ドメイン固有のパラメータ更新を必要としません。
セマンティック-シンボリック整合機構を導入し、高次元の流れテンソルをトポロジー的な言語記述子へ射影することで、モデルが生のピクセル値ではなく物理的構造を知覚できるようにします。
物理法則に導かれた思考過程（PG-CoT）ワークフローを構築し、動的制約の注入（例：質量保存）と反復的な自己検証を通じて推論を組み立てます。
微視的乱流、理論的ナビエ-ストークス方程式、巨視的全球天気予報にわたるベンチマークでの実証結果は、OMNIFLOW がゼロショット一般化と少数ショット適応において従来のディープラーニングのベースラインを大幅に上回り、透明で物理的に整合した推論レポートを提供することを示しています。

要約: 大規模言語モデル（LLMs）は卓越した論理推論能力を示してきましたが、多くの場合、偏微分方程式（PDEs）によって支配される連続的な時空動態に苦戦し、しばしば非物理的な幻覚を生み出します。従来のアプローチは通常、コストの高い領域特化のファインチューニングに頼る傾向にあり、ドメイン間の一般化能力と解釈可能性を著しく制限します。これらのギャップを埋めるべく、ドメイン特化のパラメータ更新を要求しない凍結された多模態 LLM を基本的な物理法則に結びつけるよう設計されたニューラル-シンボリックアーキテクチャ OMNIFLOW を提案します。OMNIFLOW は、新規の \textit{意味-記号の整合} メカニズムを導入します。これは高次元の流れテンソルをトポロジカルな言語記述子へ投影し、モデルが生のピクセル値ではなく物理的構造を知覚できるようにします。さらに、動的制約注入（例：質量保存）と反復的な自己検証を組み合わせた、物理を導く思考の連鎖（PG-CoT）ワークフローを構築します。OMNIFLOW を、微視的乱流、理論的ナビエ-ストークス方程式、そして巨視的な地球規模天気予測にわたる包括的なベンチマークで評価します。経験的な結果は、OMNIFLOW がゼロショット一般化および少数ショット適応タスクで従来の深層学習ベースラインを大幅に上回ることを示しています。重要なことに、それは透明で物理的に一貫した推論レポートを提供し、ブラックボックス適合から解釈可能な科学的推論へのパラダイムシフトを示します。

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

Dev.to

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

Dev.to

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

Dev.to

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

Dev.to

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

Dev.to

OMNIFLOW: 一般化された科学的推論のための物理に基づくマルチモーダルエージェント

要点

関連記事

Day 10: 230回の奮闘セッション、結局は一人の人間が文書を読むことに尽きる

本番環境で壊れる、バイラルなAIコーディングデモの背後に潜む5つの危険な嘘

二つのボット、混乱したサーバー: NimbusがAIエージェントのアイデンティティについて明らかにしたこと

OpenTelemetryがLLMトレーシングを標準化しました。コード上では実際にはこのようになっています。

PIXIU: 金融分野向けの大規模言語モデル、指示データ、および評価ベンチマーク

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer