Solidity LMがOpusを上回る

Reddit r/LocalLLaMA / 2026/5/6

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

共有:

要点

投稿者は、Solidity向けの言語モデル「Solidity LM」を作る週末プロジェクトの結果として、同一タスクセットで「Opus」をpass@1で上回ったと報告しています。
投稿では、モデルはまだ改良の余地があるものの、フィードバックを歓迎すると述べられています。
そのモデルはHugging Faceで公開されており（Qwen3.6-Solidity-27B）、コミュニティによる検証と改善を促す意図が示されています。
投稿者は、モデル開発とベンチマーク比較にかけた時間と費用の大きさを強調しています。

週末のプロジェクトが少し手が大きくなりましたが、最終結果には満足しています。

同じ一連のタスクで、soleval の pass@1 が Opus 4.7 を上回りました。ここにはまだもう少し作業の余地がありますが、どんなフィードバックも歓迎です。この件にかなりの時間（そしてお金）を費やしました！