広告

フォーミュラ・ワン・プロンプティング:応用数学のための方程式優先の推論

arXiv cs.CL / 2026/3/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、課題の説明からまず支配方程式を定式化し、その後に解くという流れを、二段階の単一コール(single-call)プロンプティングとして行う手法「Formula-One Prompting(F-1)」を提案する。
  • 方程式の形式化が行われた後、モデルは、明示的なルーティング規則ではなく、方程式の構造に基づいて適切な解法戦略(例:CoT、PoT、または直接計算)を選択する。
  • 5つのLLMと4つのベンチマークに対する実験により、F-1は平均でChain-of-Thought(CoT)を+5.76%、Program-of-Thought(PoT)を+8.42%上回ることが示される。
  • F-1はまた、60件のベンチマークモデル比較のうち53勝(88.3%)を達成し、特にFinanceMathのような応用領域でCoTに対して+13.30%と最大の改善が見られる。
  • 著者らによる問題ごとの分析では、主要な性能向上要因は、そもそも方程式の形式化段階そのものにあることが示されており、OlympiadBench内の物理スタイルの問題ではより大きな伸びが得られる。

広告