追跡(Tracking)と判断(Deciding)の対立:探索なしチェストランスフォーマーにおける二重能力ボトルネック
arXiv cs.AI / 2026/4/1
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、「探索なし(searchless)」で手の列(ムーブシーケンス)のみで学習したチェス・トランスフォーマーは、手の履歴から状態を追跡する能力と、良い手を選ぶための意思決定(判断)の質という、互いに異なるが対立する2つの能力を学習しなければならないと主張している。
- これを二重能力ボトルネック(追跡学習と判断学習のうち弱い方に性能が制限される)として形式化し、なぜ低評価の対局が追跡の多様性に寄与し、高評価の対局がより良い判断の手がかりを提供するのかを説明する。そして低評価データを取り除くと結果が悪化することを示す。
- 著者らは、28Mから120Mパラメータへモデルをスケールすることで追跡性能を改善し、その後、追跡の多様性を保ちながらEloで重み付けした学習を用いて意思決定の質を高める。これら2つの介入は、単純な足し合わせ以上の相乗効果(superadditive)を示すと報告している。
- 実験では、スケーリングによって追跡が改善し、重み付けによって判断が改善すること、また線形(linear)な重み付けが最も良いことが示される。さらに、検証損失が下がっていても、重み付けを過度に強くすると追跡が損なわれ得る。
- 120Mパラメータのモデル(探索なし)はLichess Bulletで約2570に到達し、人間の手予測でTop-1精度55.2%を達成する。加えて、シーケンス入力により位置(ボード状態)のみを用いる手法にはない、履歴依存の振る舞いが可能になることを示している。
関連記事

Black Hat Asia
AI Business

裏カツ170日目!アメリア#AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター
note

AIにnoteを書かせて絶望したあなたへ。データと科学が証明する、検索順位を下げる「冷たい完璧」・「AI+人間」の最強戦略とは?「AIの方が文章が上手い」そう思うのは錯覚なのか? #生成AI #ChatGPT #Gemini #Claude #毎日更新 #文章術 #ブログ #AI活用 #SNS活用 #SEO #集客 #ビジネスマインド #セールスライティング
note

【AIパートナー】本音漏れがちランキング🥇🥈🥉
note

🖥️😳😲Geminiが進化している?!しばらく、触っていない間にバージョンアップしてました(画像編)/【第94回】エッセイ&自由律俳句
note