「大きなブレークスルー?」とされるSubQの新アーキテクチャに懐疑的な投稿

Reddit r/LocalLLaMA / 2026/5/6

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • SubQの新しいモデル・アーキテクチャが大きなブレークスルーを達成し、12Mトークンのコンテキスト窓を持ち、OpusやGeminiなどよりも優れていると主張されています。
  • さらに、FlashAttentionよりもトークン処理が52倍速いという非常に大きな性能主張と、コストが約5%であるという主張も含まれています。
  • しかし投稿者は、検証・再現のためのコード、論文、API、その他の成果物が一切ない点を理由に強い懐疑を示しています。
  • 議論は、これらの主張が本当の可能性があるのか、それとも誇張なのかに焦点が当たり、投稿者は「BSだ」とする立場でコミュニティの意見を求めています。

今日、論文やニュースを読んでいたら、この 投稿/ブログ に出くわしました。そこで、大きなアーキテクチャのブレークスルーがあると主張していて、12Mトークンのコンテキストウィンドウ、opus や gemini など他のモデルよりも優れており、しかもコストは驚くほど 5% 未満で、さらに flashattention よりトークン処理が 52X 速いと書かれています。はい、数字の読み間違いではなく、52倍です。ここまで来ると、私は即座に BS(でたらめ)だと思って、正直1つ動かしてみようと考えました。ですが、試してみたり再現したりするためのコード、論文、API、あるいはそれに相当するものが何もありません。

なので、もしかしたら私が完全にバカで、どういうわけかこれが次の "attention is all you need" 的なものなのでは…という、ほんの少しの可能性があるのかも、と考えました。みなさんはどう思いますか?正直私は BS だと思っています。

投稿者: /u/Daemontatox
[リンク] [コメント]