Solidity LMがOpusを上回る

Reddit r/LocalLLaMA / 2026/5/6

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 投稿者は、Solidity向けの言語モデル「Solidity LM」を作る週末プロジェクトの結果として、同一タスクセットで「Opus」をpass@1で上回ったと報告しています。
  • 投稿では、モデルはまだ改良の余地があるものの、フィードバックを歓迎すると述べられています。
  • そのモデルはHugging Faceで公開されており(Qwen3.6-Solidity-27B)、コミュニティによる検証と改善を促す意図が示されています。
  • 投稿者は、モデル開発とベンチマーク比較にかけた時間と費用の大きさを強調しています。

週末のプロジェクトが少し手が大きくなりましたが、最終結果には満足しています。

同じ一連のタスクで、soleval の pass@1 が Opus 4.7 を上回りました。ここにはまだもう少し作業の余地がありますが、どんなフィードバックも歓迎です。この件にかなりの時間(そしてお金)を費やしました!

https://huggingface.co/samscrack/Qwen3.6-Solidity-27B

投稿者: /u/swingbear
[リンク] [コメント]