要旨: 農産物のコモディティ価格に対する正確な短期予測は、食料安全保障の計画と開発途上国における小規模農家の収入の安定化にとって重要である。しかし、この目的に適した機械学習対応のデータセットは、南アジアでは依然として希少である。本論文は2つの貢献を行う。第一に、AgriPriceBDを導入する。これはバングラデシュの5つのコモディティ(にんにく、ヒヨコマメ、青唐辛子、きゅうり、甘いかぼちゃ)について、2020年7月から2025年6月までを対象とした、1,779件の日次の小売中間価格からなるベンチマークデータセットである。これらは、LLM支援によるデジタル化パイプラインを通じて政府の報告書から抽出した。第二に、古典的モデル(ナイーブな永続、SARIMA、Prophet)から、深層学習アーキテクチャ(BiLSTM、Transformer、Time2Vec強化Transformer、Informer)までを対象として、Diebold-Mariano統計的有意性検定を用い、7つの予測アプローチを評価する。コモディティ価格の予測可能性は本質的に不均一である。ナイーブな永続は、ほぼランダムウォーク的なコモディティでは支配的である。Time2Vecによる時間的エンコーディングは、固定の正弦波(サイン)エンコーディングに対して統計的に有意な優位性を提供せず、青唐辛子で致命的な劣化を引き起こす(+146.1% MAE, p<0.001)。Prophetは系統的に失敗する。これは、その滑らかな分解という仮定と両立しない、離散的なステップ関数型の価格ダイナミクスに起因する。Informerは、(真値に対する)分散が最大50倍に達するなど、予測が不安定である。これは、疎な注意(スパース・アテンション)を用いるTransformerには、小規模な農業データセットが提供できるものよりも実質的に大きな学習データセットが必要であることを裏付ける。再現と、バングラデシュおよび同様の開発途上国における農産物コモディティ市場の将来の予測研究を支援するため、すべてのコード、モデル、データを公開する。
新規のバングラデシュ市場価格データセットに基づく、農業コモディティ価格予測のための古典モデルと深層学習モデルのベンチマーク
arXiv cs.LG / 2026/4/9
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、バングラデシュの新たに公開されたコモディティ・ベンチマーク・データセット AgriPriceBD を紹介する。これは5つのコモディティについて、2020年7月〜2025年6月の1,779日分の小売の中間価格(mid-price)を含み、政府レポートをLLM支援パイプラインでデジタイズしたものである。
- 7つの短期予測手法をベンチマークする。古典的手法(パーシステンス、SARIMA、Prophet)から、深層学習モデル(BiLSTM、Transformer、Time2Vec-Transformer、Informer)までを含む。
- 結果から、コモディティ価格の予測可能性は非常に不均一であることが示される。単純なパーシステンスは、ランダムウォークに近いコモディティで最も良好に機能する一方、Prophet は価格が段階的(step-like)に変化するため滑らかさに関する仮定に違反し、性能が低下する。
- Time2Vec による時間的エンコーディングは、固定の正弦波エンコーディングに対して有意な改善をもたらさず、さらに青唐辛子(green chilli)では壊滅的に性能を悪化させる(MAEが+146.1%、p<0.001)。
- Informer の疎注意(sparse-attention)を用いる Transformer 手法は、不安定な予測を生成し、予測の分散が正解データの最大50倍に達することがある。このことは、利用可能な小規模な農業データセットでは、こうしたモデルには大幅に大きい学習データが必要であることを示唆している。著者らは、再現のためにコード、データ、モデルを公開している。




