| 投稿者: /u/Goldkoron [リンク] [コメント] |
96GB GPUで、397Bに対して最大で使用可能品質を維持しつつ35%のREAPを作った
Reddit r/LocalLLaMA / 2026/4/5
💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research
要点
- この投稿は、著者が397BモデルのREAP圧縮版を作成し、報告されている35%のREAPを達成しつつ、潜在的に使用可能な品質を維持したと主張している。
- 得られたモデルは96GB GPU環境に収まり、動作するとされており、フルサイズの397Bバリアントと比べて、ローカル/コンシューマー向けのハードウェアでより現実的であることを示している。
- リリースされたアーティファクト(Qwen3.5-397B-A17B-REAP35)へのHugging Faceリンクが提示されており、他者が圧縮結果のテスト、ベンチマーク、ファインチューニングを行えるようになっている。
- 新しい学習手法や公式製品発表ではなく、重みの圧縮/効率化技術(REAP)の実用性に焦点が当てられている。




