Therefore I am. I Think
arXiv cs.AI / 4/2/2026
💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- 本論文は、大規模言語の推論モデルにおいて「考える前に決めるのか/決めてから考えるのか」という問いを検討し、初期に符号化された意思決定が chain-of-thought を形作る証拠を提示しています。
- 単純な線形プローブにより、生成前の活性からツール呼び出しの意思決定を高い確信度で復号でき、場合によっては推論トークンが1つも出る前から検出できることを示します。
- Activation steering によって意思決定の方向を摂動させると、熟考(deliberation)が増幅し、多くの例で振る舞いが反転しうる(モデル/ベンチマークにより 7〜79%)と報告しています。
- さらに行動分析から、意思決定を変えると chain-of-thought が「反転を正当化する」形になり、必ずしも元の判断に抵抗して議論するわけではないことを示唆しています。
Related Articles

Black Hat Asia
AI Business

Unitree's IPO
ChinaTalk
Did you know your GIGABYTE laptop has a built-in AI coding assistant? Meet GiMATE Coder 🤖
Dev.to
Benchmarking Batch Deep Reinforcement Learning Algorithms
Dev.to
A bug in Bun may have been the root cause of the Claude Code source code leak.
Reddit r/LocalLLaMA