コード生成における多数決(Majority Voting)

arXiv cs.LG / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMによるコード生成に対して、複数の出力の実行時シグネチャをテスト入力上で比較し、代表解を選ぶテスト時戦略としてFunctional Majority Voting(FMV)を提案している。
  • 実験では、FMVがLiveCodeBenchで性能を大きく向上させつつ、計算コストの増加は小さいことが示されている。
  • 著者らはこの「機能的な多数決(functional consensus)」を拡張し、コードに限らずラベルなしのテスト時強化学習における集約手法として適用し、ホールドアウト課題でpass@1の改善を報告している。
  • ただし、アプローチがベースモデルの性能上限を超える自己改善をもたらすという証拠は見つかっていない。