96GB GPUで、397Bに対して最大で使用可能品質を維持しつつ35%のREAPを作った

Reddit r/LocalLLaMA / 2026/4/5

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • この投稿は、著者が397BモデルのREAP圧縮版を作成し、報告されている35%のREAPを達成しつつ、潜在的に使用可能な品質を維持したと主張している。
  • 得られたモデルは96GB GPU環境に収まり、動作するとされており、フルサイズの397Bバリアントと比べて、ローカル/コンシューマー向けのハードウェアでより現実的であることを示している。
  • リリースされたアーティファクト(Qwen3.5-397B-A17B-REAP35)へのHugging Faceリンクが提示されており、他者が圧縮結果のテスト、ベンチマーク、ファインチューニングを行えるようになっている。
  • 新しい学習手法や公式製品発表ではなく、重みの圧縮/効率化技術(REAP)の実用性に焦点が当てられている。