M1 Max でモデル学習に挑んで完敗した記録
Zenn / 2026/4/7
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage
要点
- M1 Max環境でのモデル学習に挑戦したが、期待どおりに進まず「完敗」した体験が記録として共有されている。
- 計算資源(Macの性能)だけでは学習の成立や実験の成功に直結しないことが示唆され、環境・設定・前提の難しさが浮かぶ。
- 学習に必要な条件(ワークフロー、データ準備、学習設定など)のギャップが、実行段階で障壁になった可能性が高い。
- 「やってみた結果」を通じて、個人環境での学習トライがどこでつまずきやすいかの実務的な学びが提供される。
はじめに
2026年4月に公開された論文「Screening Is Enough」(arXiv:2604.01178、中西健、RIKEN/東大)の主張が気になりました。
Softmax Attention を Screening Attention に置き換えると、パラメータ4割減で同等性能が出る
自分の手元でも検証してみたくなりました。
せっかくなら Softmax だけでなく、2025年にAppleが提案した Sigmoid Attention(ICLR 2025)も含めた3方式を同じ骨格で比較してみよう。日本語Wikipediaをコーパスに使い、MacBook Pro(M1...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



