DeepSeek Flashは少なくともHaikuの良い代替になりそう

Reddit r/LocalLLaMA / 2026/4/25

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 著者は、ツール呼び出しと要約を主目的に、複雑なツール入力スキーマを扱うためにチャットシステムでHaikuを使っていると述べています。
  • DeepSeek v4 FlashとHaikuを比較する評価を行ったところ、プロンプトの微調整だけでFlashのほうがHaikuを上回ったと報告しています。
  • 著者は、Flashが多数のツール呼び出しを特に積極的かつ正確に行い、非常に賢いモデルのような印象を与えると評価しています。
  • ベンチマーク上はより上位(例:Sonnetレベル)に相当する可能性に触れつつ、自身の根拠はHaikuとの比較に限られているとも述べています。
  • Flashは価格面でHaikuより安いように見えるため、実務上の代替になり得ると強調しています。

私たちはチャットシステムで俳句(haiku)を使っています。というのも、それは主にツール呼び出しと、それらの要約に関するものだからです。しかし、入力スキーマがかなり複雑なツールがたくさんあり、gemmaのようなものではうまくいきませんでした。そこで俳句を選びました。俳句はかなり良いです。

今日はdeepseek v4 flashの評価(evals)を、俳句と比較して実行しましたが、かなり見事に勝っています――ただし、いくつかプロンプトの調整をしただけです。Flashはとても積極的で、非常に正確に多くのツール呼び出しを行い、そして不思議と「とても賢くて知的なモデル」という感覚を与えてくれます。ベンチマークを見る限り、おそらくsonnetレベルの話なのだと思いますが、価格を見るとHaikuよりも安いです。また、sonnetと比較した評価は持っていないので、判断できるのは俳句との比較だけです。

提出者 /u/cant-find-user-name
[link] [comments]