要旨: Chain-of-Thought(CoT)推論は大規模言語モデルを強化し得ますが、それにはモデルを導くための手動で設計されたプロンプトが必要です。近年提案されたCoT-decodingは、プロンプトなしでモデルがCoT形式の推論経路を生成できるようにしますが、固定された解答集合を持つ問題にのみ適用可能です。こうした制限に対処するため、我々は、より広範な質問応答タスクに適用範囲を拡張する一般的なデコーディング戦略であるGCoT-decodingを提案します。GCoT-decodingは、Fibonacci samplingとヒューリスティックな誤りのバックトラッキングを組み合わせた二段階の分岐手法を用いて、候補となるデコーディング経路を生成します。次に、各経路を推論スパンと解答スパンに分割して経路の信頼度を正確に計算し、最後に意味的に類似した経路を集約して合意(コンセンサス)となる解答を特定します。これは従来の多数決(majority voting)に代わるものです。固定および自由形式の両方のQAタスクを対象とした6つのデータセットに対して大規模な実験を行いました。我々の手法は固定QAにおいて強い性能を維持するだけでなく、自由形式QAでも大きな改善を達成し、その汎用性を示しています。
GCoT-Decoding:汎用質問応答のための深い推論パスを解き放つ
arXiv cs.CL / 2026/4/9
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、手作業で設計したプロンプトなしに、チェーン・オブ・ソート風の推論パスを生成する一般的なデコーディング戦略「GCoT-decoding」を提案する。
- 従来のCoTデコーディング手法を拡張し、固定の答え集合に基づくQAだけでなく、よりオープン/自由形式のQA設定にも対応することで、適用可能性における重要な制約を解消する。
- 提案手法は、候補となるデコーディングパスを生成するために、二段階の分岐プロセス(フィボナッチ・サンプリング+ヒューリスティックな誤りのバックトラッキング)を用いる。
- 信頼度は、候補パスを推論スパンと解答スパンに分割して算出し、多数決投票の代わりにセマンティックなクラスタリング/集約を行うことで合意解答を選択する。
- 6つのデータセットにわたる実験により、固定QAでの強い性能と、自由QAでの大幅な改善が示され、一般性の向上という主張を支持する。


