量子場理論（QFT）向けに小規模な推論モデルをファインチューニングする

arXiv cs.LG / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

この論文は、理論物理に特化した小規模（約7B）推論モデルを対象に、学習中にドメイン推論能力がどのように育つかを調べる初の学術的ファインチューニング研究を提示しています。
オープンソースで検証可能な物理学の学習データが乏しいため、著者らは合成のQFT問題を作成し、既存の人手で書かれた問題を学習用に適応させる堅牢なデータ生成パイプラインを構築しています。
合成の量子場理論問題を2,500問以上生成し、arXivや標準的な教育資料から得た人手適応問題のキュレーション集合も用意しています。
強化学習（RL）と教師ありファインチューニング（SFT）を比較し、他の物理ドメインへの汎化とともに性能向上を評価します。
チェーン・オブ・ソート（推論の連鎖）を、ファインチューニング前後で詳細に分析し（RL/SFTにおける誤りの変化も含む）、さらにパイプライン、検証可能なQFT学習データ、約2億トークン規模のQFT推論トレースを公開しています。

Dev.to

Dev.to

Dev.to

Dev.to

The Verge