私は Autochess NN を作りました。これは、AlphaZero 系のシステムを実際に一から構築することで理解を深める個人的な実験として始まった、ブラウザで遊べるニューラルチェスエンジンです。
このプロジェクトは遠慮なく vibecoded されたものですが、それは“API の薄いラッパー”という意味ではありません。私は Karpathy に影響を受けた自動研究ワークフローの中で、AI を研究・コーディングの補助として大量に活用しました。論文を読み、アイデアを検証し、プロトタイピングを行い、アブレーションを実施し、最適化し、繰り返す。私にとって興味深いのは、そのループが家庭用ハードウェア(ただのゲーミング RTX 4090)でどこまで動くのかを見ることでした。
現在の公開版 V3:
- 残差 CNN + Transformer
- 学習済み思考トークン
- 約1,600万パラメータ
- 19平面 8x8 入力
- 4672手のポリシーヘッド + バリューヘッド
- 1億以上の局面で訓練
- パイプライン: 2200件超の Lichess 監督付き事前学習 -> Syzygy 終盤ファインチューニング -> 検索蒸留を用いた自己対戦強化学習
- CPU 推論 + 浅い 1手先読み / クイエシエンス探索(2ms未満)
また、モデルが検査可能であるようにブラウザアプリに組み込み、ベンチマークだけでなく検査可能な状態にしました:AI との対戦、盤面エディタ、PGN のインポート/リプレイ、パズル、そして「思考」ステップがそれらの確率をどのように動かすかを示す手の解析。
驚いたのは、多くの最適化を経た結果、これがその強さに対して異常に計算効率が高くなっている可能性があるということです。おそらく 2500 Elo 以上の趣味向け神経チェスエンジンの中でも、かなり効率的な部類の1つかもしれません。これはマーケティングの主張としてではなく、検証のための仮説として述べており、評価手法に対する批判を心から歓迎します。
現在は V4 に取り組んでおり、別のアーキテクチャを採用しています:
- CNN + Transformer + Thought Tokens + DAB (Dynamic Attention Bias) @ 50M パラメータ
V5 では、Temporal Look-Ahead と呼んでいるより推測的な試みをテストしたいと考えています。ネットワークは内部で将来の手を表現し、それをアテンションを介して後方へ伝播させ、現在の意思決定を情報で補います。
プロジェクトの詳細: https://games.jesion.pl/about
価格: 無料のブラウザデモ。公開リーダーボードに掲載されたい場合のみ、ニックネーム/メールが必要です。
- 最も欲しいフィードバック:
- 思考トークン / DAB の最良のアブレーション設定
- 自宅用ハードウェアで Elo-vs-計算効率を測るためのより良い方法
- Temporal Look-Ahead の枠組みが本当に有用か、それとも既知のものの派手なリブランドに過ぎないか
- 過大な主張を避けつつ古典エンジンに対する評価を強化するアイデア
よろしく、Adam
[リンク] [コメント]




