広告

株式投資にAIを使うと? Claudeは「コツコツ」、Geminiは「大胆」──見えた“性格の違い”

ITmedia AI+ / 2026/4/1

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • LLMを用い、投資戦略の分析→改善案→Pythonコード修正を反復させる実証を実施し、モデル特性によって改善の出方が大きく変わることを確認した
  • フィードバック情報(基本損益指標のみ vs 予測精度・リスク指標追加)や提示形式(テキストのみ vs グラフ画像)を工夫しても、損益の年率改善幅は大きくは伸びなかった
  • 主要な差分はモデル選択で、Claude系が平均年率8〜14%改善、Gemini系が平均約7%改善、GPT系は平均-3〜4%と明確に結果が分かれた
  • さらにClaude系は既存戦略を保ったまま局所修正を積み上げる傾向、Gemini系は戦略から逸脱して探索する傾向、GPT系は(特にGPT-5で)保守的でコード変更が少ない傾向が見えた
  • ただし細かなフィードバック設計は「戦略実装の質」には影響し、リスク要因依存を打ち消す実装や、市場局面に応じて振る舞いを切り替える実装が増えた

 AIに株式投資の戦略を改善させると、モデルごとに挙動特性の違いが現れる──。東京大学の松尾豊教授が率いる株式会社松尾研究所の研究グループは2026年3月18日、こうした実証結果を発表した。

 研究では、LLMに過去データでのシミュレーション結果を提示して戦略の分析と改善案の提示、Pythonコードの修正を繰り返させる反復的なループを構築。フィードバックに含める情報を「基本的な損益指標のみ」と「予測精度やリスク構造の指標を追加」、提示形式を「テキストのみ」と「テキスト+グラフ画像」という2軸で整理し、3つの条件を比較した。

 対象データは金融セクターを除くTOPIX 500の2014~2022年の日次データ。GPT系3モデル(「GPT-5 nano」「GPT-5 mini」「GPT-5」)、Gemini系2モデル(「Gemini 3 Flash Preview」「Gemini 3 Pro Preview」)、Claude系3モデル(「Claude Haiku 4.5」「Claude Sonnet 4.5」「Claude Opus 4.5」)の計8モデルを使用した。

 実験の結果、フィードバックに追加情報やグラフを加えても、損益の年率改善幅には明確な向上が見られなかった。一方、使用するモデルの違いはパフォーマンスに大きく影響し、Claude系モデルが平均年率8~14%の改善を示したのに対し、Gemini系は平均7%、GPT系は平均-3~4%という結果だった。損益の改善幅が最も大きかったのはClaude Sonnet 4.5だった(平均年率14.12%)。

初期戦略の対する損益の年率改善幅。FXUR、IID、SMDAはそれぞれ初期戦略の名称。P1~3は初期戦略に対しての改善プロンプト。Claude系の改善幅が大きいことが分かる(出典:論文)

 Claude系は既存戦略の構造を保ちつつ局所的な修正を積み上げる傾向があり、安定的な改善につながった。Gemini系は初期戦略から大きく逸脱して新たな戦略を探索する傾向が強く、改善幅の分散が大きかった。GPT系(特にGPT-5)は既存コードをほとんど変更しない保守的な挙動を示した。

 研究グループは、LLMを用いた投資戦略の自動生成においてはフィードバックの細かな設計よりもモデル選択が主要な設計要素になり得ると結論づけている。

 フィードバック設計がパフォーマンスには効かなくても、LLMが実装する手法の「質」には影響を与えていたという。戦略がどのリスク要因に依存しているかを示す指標を提示すると、そうした要因への依存を打ち消す実装が増えた。また、時系列のグラフを提示すると、市場の局面変化に応じて戦略の振る舞いを動的に切り替える実装が増加した。与える情報の種類に応じて、LLMの改善方針が変化することが確認された。

 同研究は3月21~22日開催の人工知能学会 金融情報学研究会でも報告された。

関連記事

関連リンク

Copyright © ITmedia, Inc. All Rights Reserved.

続きを読むには、コメントの利用規約に同意し「アイティメディアID」および「ITmedia AI+メールマガジン」の登録が必要です

広告