要旨: 専門分野のタスク適応と能力強化の方向性にある大規模言語モデル(LLMs)は、顕著な応用ポテンシャルを示します。とはいえ、燃焼科学のような複雑な物理系に対して、汎用のLLMsは領域知識が不足していることと物理的保存則を遵守できないことから、しばしば深刻な幻覚を生み出します。これに対処するため、燃焼科学の分野向けに特化した初のフルスタックのドメイン強化LLMワークフローを提案します。自動化されたドメインコーパス構築、逐次的な事前学習、指示のファインチューニング、検証可能な報酬ベースの強化学習を統合しています。このワークフローは、モデルが単にテキストの統計的パターンを学習するだけでなく、物理法則を真に内在化することを保証します。また、燃焼科学の複雑な推論タスクに特化して設計された標準化評価ベンチマーク FlameBench を公開します。実験結果は、本研究で開発されたモデルが、最先端の汎用のクローズドソースモデルおよび従来の検索強化付き生成法を、燃焼科学の推論タスクで大幅に上回ることを示しています。本研究は、信頼性の高い科学的推論能力を備えたドメイン特化型の科学研究エージェントの今後の開発に向けて、堅固な技術的・資源的基盤を築きます。
返却形式: {"translated": "翻訳されたHTML"}




