AI Navigate

[P] 自宅PC上の Vibecoded: Karpathyに触発されたAI支援の研究ループを用いて、約2700 Elo のブラウザでプレイ可能なニューラルチェスエンジンを構築

Reddit r/MachineLearning / 2026/3/21

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • Adam Jeisonは、家庭用ハードウェア上でCPU推論と浅い1手先読みを行うブラウザ上でプレイ可能なニューラルチェスエンジン Autochess NN を構築した。
  • 現在の公開版(V3)は、約1600万パラメータのResidual CNN + Transformer、19平面8x8入力、4672通りの手を出力するポリシーヘッドと値関数ヘッドを組み合わせ、Lichessによる教師あり事前学習、Syzygy終盤微調整、探索蒸留を伴う自己対戦強化学習のパイプラインを通じて100M局面超で学習されている。
  • 彼は Karpathyに触発された自己研究ループを採用し—論文を読む、プロトタイプを作成、アブレーションを行い、最適化を繰り返す—イテレーションの効率を高め、家庭用ハードウェア上で2500 Eloを超える、計算資源効率の高い強さを実現している。
  • 今後の作業には、V4として50MパラメータのCNN+Transformer+思考トークン+DAB、V5として時系列先読み、公開ブラウザデモとプロジェクトページの公開、アブレーションと評価手法へのフィードバックのお願いが含まれる。

私は Autochess NN を作りました。これは、AlphaZero 系のシステムを実際に一から構築することで理解を深める個人的な実験として始まった、ブラウザで遊べるニューラルチェスエンジンです。

このプロジェクトは遠慮なく vibecoded されたものですが、それは“API の薄いラッパー”という意味ではありません。私は Karpathy に影響を受けた自動研究ワークフローの中で、AI を研究・コーディングの補助として大量に活用しました。論文を読み、アイデアを検証し、プロトタイピングを行い、アブレーションを実施し、最適化し、繰り返す。私にとって興味深いのは、そのループが家庭用ハードウェア(ただのゲーミング RTX 4090)でどこまで動くのかを見ることでした。

現在の公開版 V3:

  • 残差 CNN + Transformer
  • 学習済み思考トークン
  • 約1,600万パラメータ
  • 19平面 8x8 入力
  • 4672手のポリシーヘッド + バリューヘッド
  • 1億以上の局面で訓練
  • パイプライン: 2200件超の Lichess 監督付き事前学習 -> Syzygy 終盤ファインチューニング -> 検索蒸留を用いた自己対戦強化学習
  • CPU 推論 + 浅い 1手先読み / クイエシエンス探索(2ms未満)

また、モデルが検査可能であるようにブラウザアプリに組み込み、ベンチマークだけでなく検査可能な状態にしました:AI との対戦、盤面エディタ、PGN のインポート/リプレイ、パズル、そして「思考」ステップがそれらの確率をどのように動かすかを示す手の解析。

驚いたのは、多くの最適化を経た結果、これがその強さに対して異常に計算効率が高くなっている可能性があるということです。おそらく 2500 Elo 以上の趣味向け神経チェスエンジンの中でも、かなり効率的な部類の1つかもしれません。これはマーケティングの主張としてではなく、検証のための仮説として述べており、評価手法に対する批判を心から歓迎します。

現在は V4 に取り組んでおり、別のアーキテクチャを採用しています:

  • CNN + Transformer + Thought Tokens + DAB (Dynamic Attention Bias) @ 50M パラメータ

V5 では、Temporal Look-Ahead と呼んでいるより推測的な試みをテストしたいと考えています。ネットワークは内部で将来の手を表現し、それをアテンションを介して後方へ伝播させ、現在の意思決定を情報で補います。

デモ: https://games.jesion.pl

プロジェクトの詳細: https://games.jesion.pl/about

価格: 無料のブラウザデモ。公開リーダーボードに掲載されたい場合のみ、ニックネーム/メールが必要です。

  1. 最も欲しいフィードバック:
  2. 思考トークン / DAB の最良のアブレーション設定
  3. 自宅用ハードウェアで Elo-vs-計算効率を測るためのより良い方法
  4. Temporal Look-Ahead の枠組みが本当に有用か、それとも既知のものの派手なリブランドに過ぎないか
  5. 過大な主張を避けつつ古典エンジンに対する評価を強化するアイデア

よろしく、Adam

投稿者 /u/Adam_Jesion
[リンク] [コメント]