要旨: 本論文は、LLM(大規模言語モデル)の数学的創造性に関する一連の研究の第2回目です。最初の論文では、著者らはLLMの数学的創造性を評価するための3つの基準を提案し、それを測定するためのベンチマークデータセットを構築しました。本論文は、LLMの数学的創造性をさらに探究し、LLMが価値のある最先端の数学研究問題を生成できるかどうかを調査することに焦点を当てています。未知の問題を生成するエージェントを開発し、微分幾何学における665個の研究問題を生み出しました。人間による検証を通じて、これらの数学的問題の多くが専門家には未知であり、独自の研究価値を有していることが分かりました。
返却形式: {"translated": "翻訳されたHTML"}