多数決を超えて:放射状コンセンサススコアによる効率的なベスト・オブ・N

arXiv cs.CL / 2026/4/15

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMにおける best-of-N 応答選択のための、学習不要(training-free)の手法「Radial Consensus Score(RCS)」を提案し、単純な多数決を超えたアプローチを示す。
  • RCSは候補回答を埋め込み、(重み付き)フレシェ平均(Fréchet mean)によって加重された意味的中心を計算し、その中心からの放射状距離にもとづいて候補を順位付けすることで、意味的コンセンサスをモデル化する。
  • 本手法は複数の重み付け方式(一様、頻度ベース、確率ベース)をサポートし、ブラックボックス環境でも合意(agreement)や信頼度のシグナルを取り込める。
  • 5つのオープンウェイト・モデルを用いた、7つのQA/推論ベンチマークでの実験により、RCSが強力なベースラインを一貫して上回り、サンプリング予算が増えるほど改善が大きくなることが示された。
  • RCSは、多者間ディベートにおける多数決のドロップイン置換としても機能し、ブラックボックス状況における頑健性も示す。幾何学的コンセンサスをスケーラブルな統合原理として捉えられることを示唆している。