| 過去をさかのぼっては作成できない予測データを含むデータセットを作成しました。 約38日間、cronjob が毎日予測を生成していました: - 10日先の予測期間 - 1日あたり約30件の予測(複数のセクターにまたがる異なる銘柄) - 固定したプロンプトとパラメータ 各実行では以下を記録: - 予測価格 - 自然言語による根拠 - センチメント - 自己申告の確信度 予測対象として株価予測を使いましたが、これは取引システムでも金融アドバイスでもなく、実験です! 現時点では何か度肝を抜かれるものは見つかっていないものの、データを可視化すると自分が面白いと感じるパターンが見えてきます。 現在は傾向、モデルのバイアス、そしてECEをプロットしているところで、今後さらに続く予定です。 もしかすると、あなたにも面白いと思えるかもしれません。 データセットはまだそれほど大きくないので、Gemini Flash と Gemini Flash-Lite モデルで、より大きい第2のものを実際に作っています。 PS: データセットや、データを素早くクロールするためのダッシュボード付きMVPに興味があるなら、コメントで気軽に言及してください。 [リンク] [コメント] |
38日分のライブAI予測データを掘り起こし、意外な発見を探す
Reddit r/artificial / 2026/4/15
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- あるクリエイターは、約38日間にわたって毎日AI予測のcronジョブを回し、固定したプロンプトとパラメータを用いて、複数のセクターにわたり1日あたり約30件の株式関連予測を生成することでデータセットを作成した。
- 各予測実行は、予測価格、自然言語の根拠、センチメント、そしてモデルが自己申告した信頼度をログに記録するため、後からは再構築できない分析が可能になっている。
- 著者は結果を可視化し、トレンドの振る舞い、モデルのバイアス、キャリブレーション指標(ECE)などのパターンを探したが、現時点では大きな「目を見張る」発見はまだないと述べている。
- 初期データセットが小さいため、Gemini Flash と Gemini Flash-Lite を用いて、それを第2のより大きなデータセットへ拡張する計画だ。あわせて、データを素早くクロールして確認するためのオプションとしてダッシュボード/MVPも用意する。
- この投稿では、それが取引システムや金融アドバイスではなく、明確に「実験」であると位置づけ、他の人に対してデータセット/ダッシュボードの要望や共同を呼びかけている。




