時系列基盤モデル vs LLM:日本株5日間予測ベンチマーク(N=100)

Zenn / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 時系列基盤モデル(時系列専用の基盤モデル)と一般的なLLMを、日本株の5日間予測タスクで比較するベンチマークが提示されています(サンプル数N=100)。
  • 予測性能を「同じ条件で」比べることで、時系列データに対する適合度が時系列基盤モデル側で優位になり得る点を検証する趣旨です。
  • LLMは汎用性が高い一方で、株価などの時系列特性に対して設計上の前提がどこまで効くかが論点になります。
  • 本記事はモデル選定の判断材料として、時系列予測領域での“LLMを使うべきか/時系列基盤モデルが妥当か”をデータに基づき検討する内容です。
時系列基盤モデル vs LLM:日本株5日間予測ベンチマーク(N=100) はじめに 「時系列専用の基盤モデル(Kronos)と、大規模言語モデル(Claude Sonnet/Opus)を日本株の短期予測に使ったらどちらが強いのか?」 この素朴な疑問を、100日間・10銘柄のバックテストで検証しました。単純な方向性予測精度だけでなく、実際の取引コストを考慮したロング・ショート戦略のシャープレシオまで計測した結果、LLM(特にClaude Opus)が時系列専用モデルに対して明確な優位性を示すという、やや意外な結論が得られました。 検証概要 モデル モデル 種別 特...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →