フォーミュラ・ワン・プロンプティング：応用数学のための方程式優先の推論

arXiv cs.CL / 2026/3/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、課題の説明からまず支配方程式を定式化し、その後に解くという流れを、二段階の単一コール（single-call）プロンプティングとして行う手法「Formula-One Prompting（F-1）」を提案する。
方程式の形式化が行われた後、モデルは、明示的なルーティング規則ではなく、方程式の構造に基づいて適切な解法戦略（例：CoT、PoT、または直接計算）を選択する。
5つのLLMと4つのベンチマークに対する実験により、F-1は平均でChain-of-Thought（CoT）を+5.76%、Program-of-Thought（PoT）を+8.42%上回ることが示される。
F-1はまた、60件のベンチマークモデル比較のうち53勝（88.3%）を達成し、特にFinanceMathのような応用領域でCoTに対して+13.30%と最大の改善が見られる。
著者らによる問題ごとの分析では、主要な性能向上要因は、そもそも方程式の形式化段階そのものにあることが示されており、OlympiadBench内の物理スタイルの問題ではより大きな伸びが得られる。