[P] Cadenza: 自律的な研究のために、W&Bログをエージェントに簡単に接続する

Reddit r/MachineLearning / 2026/4/5

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • Cadenza は、Weights & Biases(W&B)のログをエージェントに接続し、自律的な研究ワークフローを可能にするオープンソースの CLI ツールおよび Python SDK です。
  • このプロジェクトは、W&B CLI と MCP を「完全に自律した研究ループ」に活用する際の使い勝手の問題がある、という認識に対処し、遅さや「コンテキスト・ロット(context rot)」の低減を目指しています。
  • それは、設定とメトリクスのみを分析して W&B のプロジェクトを取り込み、エージェントがサンプリングできる実行(runs)のインデックス付きストアを構築します。
  • エージェントがインデックスに対してクエリを行うと、Cadenza は上位の成果を出した実験を返し、コンテキストの質を高めます。さらに、探索(exploration)と活用(exploitation)の挙動は設定可能です。
  • 著者はコミュニティからのフィードバックを歓迎しており、導入用として GitHub、ドキュメント、そして PyPI パッケージへのリンクを提供しています(どのエージェントでも利用可能)。

Wandb CLI と MCP は、完全に自律したリサーチループのためのエージェントで使うにはひどく使いにくいです。遅い、もっさりしていて扱いづらく、結果としてコンテキストが劣化(rot)します。

そこで、CLI ツールと Python SDK を作り、あなたの Wandb プロジェクトや実行(runs)を(爪が生えていてもそうでなくても)エージェントに簡単に接続できるようにしました。

CLI ツールは、あなたの wandb プロジェクトをインポートできるようにし、リサーチプロジェクトの解決空間をエージェントが把握しやすい形で実行(runs)の構造を整えることで動作します。

プロジェクトをインポートすると、インデックス作成と実行の保存のために分析されるのは config とメトリクスのみです。エージェントがこのインデックスからサンプルを取得すると、最もパフォーマンスの高い実験だけが返されるため、コンテキスト劣化が抑えられます。また、インデックスとエージェントの挙動を調整して、探索(exploration)と活用(exploitation)のトレードオフを切り替えることもできます。

あらゆるエージェントで使いやすいように、Python SDK と一緒に CLI をオープンソース化しました。

コミュニティからのフィードバックや批評をぜひいただきたいです!

Github: https://github.com/mylucaai/cadenza

Docs: https://myluca.ai/docs

Pypi: https://pypi.org/project/cadenza-cli

提出者: /u/hgarud
[リンク] [コメント]