Qwen3.6-397B-A17Bはオープンソースにする必要が絶対にある

Reddit r/LocalLLaMA / 2026/4/5

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • この投稿は、Qwen3.6-397B-A17BがQwen 3.5に比べて現実世界で大幅な改善をもたらしており、特に信頼性とタスク完了までのエンドツーエンドの性能において優れていると主張している。
  • 著者は、いくつかのベンチマーク比較がその差を十分に反映できないとしても、実際に検証した範囲では、他の「オープンソース」モデルよりもClaude Sonnetにより近い動作をする、と述べている。
  • この記事では、同等規模のモデルの過去の失敗は、ベンチマークスコアが近いとしても、実運用では「崩れてしまう」傾向に起因するとしている。
  • クラウドGPUのレンタル事業者や複数の低コスト推論プロバイダがそれらを実行できること、またオープンアクセスによって改変が可能になり検閲の制約が軽減されることを理由に、モデルをオープンソースとして公開することを提唱している。
  • 全体として、この投稿は、能力の高い大規模モデルのオープンソース提供を、単なる理論上の好みではなく、利用者とエコシステムにとって必要だと位置づけている。

ベンチマークが示すわけではありませんが、実世界のタスクにおいては 3.5 に対する大幅な改善です。このモデルは私にとって GLM-5.1 や Kimi-k2.5 よりも調子が良く、最大の改善ポイントは信頼性(reliability)です。

エンドツーエンドでちゃんと仕事を片付け、途中で台無しにしたりして何時間も無駄にしない点で、claude と同じくらい信頼できると感じます。Claude Sonnet と比べられるように感じたのは、これが初めての OS モデルです。

私たちはここ数か月、claude sonnet や opus などの OS モデルを右に左に比較してきました。ベンチマークでは近いことを示していますが、実世界では崩れてしまいます。opus に近いと主張されているモデルでさえ、私の実世界での使用では Sonnet レベルの品質に到達できていません。

これは、Sonnet にとてもよく一致していると自信をもって言える最初のモデルです。
そして、あなたたちの中に「誰もローカルで動かせないだろう」と言う人がいるかもしれませんが、はい、私たちのほとんどはノートPCで動かせないかもしれません。ですが

- クローズドなモデルでは絶対にできないことをやるために、クラウドで GPU をレンタルしている人たちがいます

- そのモデルを格安価格でホスティングしてくれる推論プロバイダが他にも 50 社あります

- このモードの検閲を取り除き、自由に使えるようにし、そして自分の望む形に改変できること

- そして他にもたくさん

ちゃんとした、実用に耐える大型のオープンソースモデルは必要です。

submitted by /u/True_Requirement_891
[link] [comments]