「DeepSeekがいてくれてよかった」

Reddit r/LocalLLaMA / 2026/4/25

💬 オピニオンIdeas & Deep AnalysisIndustry & Market MovesModels & Research

要点

  • 著者は、AI企業の一部がベースモデルの公開を行わなかったり、オープンウェイトの配布を遅らせたりするなどして、オープンウェイトから離れつつあると主張しています。
  • 具体例として、ベースモデルが存在しないケースやオープンウェイトの遅延、モデルのオープン/クローズ方針が変化するケース(qwenの例など)を挙げています。
  • 一方で、DeepSeekは毎月「驚くべき」研究を継続的に公開し、ベースモデルとオープンウェイトの両方を公式ローンチ後すぐに提供している点を高く評価しています。
  • 著者は、DeepSeekがローンチペーパーを通じて学習やアーキテクチャを詳細に説明しており、技術と効率の前進を後押ししていると考えています。
  • さらに、DeepSeekが小型モデルをあまり出していないという制約にも触れつつ、その欠点は全体的な貢献に比べれば許容できるとしています。

他社は、オープンなウェイトから徐々に離れてきており、ベースモデルをリリースしない、オープンなウェイトの配布を遅らせる、トップモデルをリリースしない(これは公正だと思いますが、それでも)ということにも気づきました。また、研究の公開もやめたようです(以前のGemmaやqwenは、モデルの学習や特性について詳細な論文がありましたが、今はブログ記事やモデルカードに置き換わっています)

Kimi(Kimi k2.5にはベースモデルがない)、GLM(glm 5および5.1にはベースモデルがない)、minimax(オープンなウェイトが遅れ、m2.7のライセンスに問題がある)およびqwen(qwen 3.5 397Bはオープンなウェイトでしたが、3.6はそうではない)

一方でdeepseekは、毎月驚くような研究を出し続けています。ベースモデルもリリースし、モデルが正式にローンチされたらすぐにオープンなウェイトを公開し、ローンチ用の論文でモデルの学習やアーキテクチャを詳細に説明しています

彼らはこの分野で非常に重要で、技術と効率を前に押し進めている存在です

残念ながら小型モデルはリリースしていませんが、すべてを手に入れることはできませんよね?

投稿者 /u/guiopen
[リンク] [コメント]

「DeepSeekがいてくれてよかった」 | AI Navigate