「step by step」は本当に精度が上がるのか — CoTとSelf-Consistencyをミニベンチで検証する

Zenn / 2026/3/13

💬 オピニオンIdeas & Deep AnalysisTools & Practical Usage

共有:

要点

CoTとSelf-Consistencyは推論を改善する可能性があるが、効果はタスクとプロンプト設計に依存する。
ミニベンチの設定で段階的推論とSelf-Consistencyの比較を行い、どの状況で有効かを検証。
すべてのケースで精度が上がるわけではなく、タスクの性質に応じて手法を使い分けるべきとの示唆。
実務上の示唆として計算コストやデータに基づく適切な戦略選択が重要。
推論戦略の比較フレームワークを提供し、モデル・データセット横断の評価を促進する。

はじめにルミナイR&Dチームの栗原です。同じ LLM に同じ問題を解かせても、そのまま聞く step by step とお願いして Chain-of-Thought（CoT）させる CoT を何回かやらせて多数決をとる（Self-Consistency）まず「考え方」を自分で決めさせてから解かせる（Self-Discover 風）といったプロンプトの違いだけで、正答率がけっこう変わります。本記事は、Wang らの論文 “Self-Consistency Improves Chain of Thought Reasoning in Language M...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →

Foundry Tools とは

Azure OpenAI Service ドキュメント

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

日経XTECH

AWS、Claude Codeにアーキテクチャ設計、コスト見積もり、構成コード生成、デプロイ実行などの能力を組み込む「Agent Plugins for AWS」公開

Publickey

ChatGPT・Gemini・Claude 比較：用途別ベストAIの選び方

AI Navigate Original

設定・ショートカット集：使いこなすための効率化テクニック

AI Navigate Original

「step by step」は本当に精度が上がるのか — CoTとSelf-Consistencyをミニベンチで検証する

要点

関連記事

Foundry Tools とは

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

AWS、Claude Codeにアーキテクチャ設計、コスト見積もり、構成コード生成、デプロイ実行などの能力を組み込む「Agent Plugins for AWS」公開

ChatGPT・Gemini・Claude 比較：用途別ベストAIの選び方

設定・ショートカット集：使いこなすための効率化テクニック

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer