AIエージェントを使ってEDA/データ分析を行い、MLモデル学習のための準備をするには?

Reddit r/MachineLearning / 2026/5/1

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • この投稿は、pd.info()などを使った手作業のデータ分析ワークフロー(欠損値処理、外れ値除去、特徴量変換など)を、AIエージェントが自律的に再現できるかを尋ねています。
  • 焦点は、機械学習モデル学習に向けてデータセットを「準備できる状態」にするためのEDA活用です。
  • 投稿者はすでにOpenCode+VS Code環境を用意しており、Claude/OpenCodeでその作業を進めるための具体的な手順を求めています。
  • さらに、前処理だけでなくローカルでの学習セットアップも(少なくとも一部)AIエージェントに任せたいという要望があります。

手作業のワークフローのように、私は pd.info() などのさまざまな関数を使って、与えられたデータを調べ、全列ごとに、null を除外したり、外れ値を取り除いたりなどして、モデルが最良の精度/結果を出せるようにデータセットを変換します。これと同様に、全体のワークフローを AI エージェントはどうやって自律的に行えるのでしょうか?すでに opencode+vscode のセットアップはありますが、どう進めればいいのか分かりません。私は claude と opencode を使えるので、ぜひ助言と手順を教えてください。

また、私の代わりにモデルを学習させたいですし、少なくとも学習のためのローカルでのセットアップをすべてやってくれるようにしたいです。

submitter /u/Arceus918
[link] [comments]