こんにちは、コミュニティの皆さん。初投稿です。
この数週間で、Minimax M2.7、Mimo-v2-pro、Nemotron 3 super、Mistral small 4 などを含む複数のモデルがリリースされました。しかし、それらは、少なくとも人工分析の観点から見ると、Qwen3.5 系列の知識密度には全く及びません。特に Qwen3.5 27B に関しては。
ベンチマークを過度に重視することは承知していますし、ベンチマークが必ずしも現実を反映するわけではないことも理解していますが、Qwen シリーズを称賛する人を何人か見かけました。
v3 シリーズ以降、Qwen モデルは自分の力以上のパフォーマンスを発揮していると感じます。
彼らの技術報告を読んで、それに寄与している可能性がある唯一の要因として見られるのは、彼らの RL 環境のスケーリングと一般化です。
それでは質問ですが、旧体制のリーダーシップの下にある Qwen チームは、他のモデルと比較してサイズ/知識/性能の面で、なぜこれほどまでに自分たちのモデルを優れたものにしているのか、どんな取り組みをしているのですか?
編集:これは技術的な質問です。ここはこの話題に適したサブですか?
[リンク] [コメント]