他社は、オープンなウェイトから徐々に離れてきており、ベースモデルをリリースしない、オープンなウェイトの配布を遅らせる、トップモデルをリリースしない(これは公正だと思いますが、それでも)ということにも気づきました。また、研究の公開もやめたようです(以前のGemmaやqwenは、モデルの学習や特性について詳細な論文がありましたが、今はブログ記事やモデルカードに置き換わっています)
Kimi(Kimi k2.5にはベースモデルがない)、GLM(glm 5および5.1にはベースモデルがない)、minimax(オープンなウェイトが遅れ、m2.7のライセンスに問題がある)およびqwen(qwen 3.5 397Bはオープンなウェイトでしたが、3.6はそうではない)
一方でdeepseekは、毎月驚くような研究を出し続けています。ベースモデルもリリースし、モデルが正式にローンチされたらすぐにオープンなウェイトを公開し、ローンチ用の論文でモデルの学習やアーキテクチャを詳細に説明しています
彼らはこの分野で非常に重要で、技術と効率を前に押し進めている存在です
残念ながら小型モデルはリリースしていませんが、すべてを手に入れることはできませんよね?
[リンク] [コメント]




