1年前ははっきりとした実力差の段差がありました。今は確信が持てなくなりましたが、想像していたのとは違う形です。
オープンウェイトのモデルが本当に追いついてきた領域は実際にあります。コーディング支援、要約、指示追従、しっかりした日常的な推論です。おそらく、実際に多くの人がこれらを使う用途の70〜80%については、きちんと量子化されたローカルモデルでも十分に競争力があります。これは18か月前には当てはまりませんでした。
しかし、残るギャップは頑固です。深い多段階の推論、領域をまたいだ幅広い事実の正確さが必要なもの、不確実性の中での新規な問題の統合です。そうしたことは、いまだに1世代遅れているように感じられます。そして厄介なのは、それが固定された目標ではないことです。オープンなモデルが近づくたびに、フロンティアも前に進みます。
私が解けないのは、それが長期的に持続可能なのかどうかです。ある時点でアーキテクチャが成熟し、ギャップが完全に崩れ去るのかもしれません。あるいは、計算資源へのアクセスが天井を無限に動かし続けるのかもしれません。
実際に両方を定期的に使っている人たちに聞きたいのですが、オープンモデルに本当に置き換えを試みて、それでもうまくいかなかった特定のタスクカテゴリはありますか?
[link] [comments]




