[P] Cadenza: 自律的な研究のために、W&Bログをエージェントに簡単に接続する

Reddit r/MachineLearning / 2026/4/5

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

原文を読む →

共有:

要点

Cadenza は、Weights & Biases（W&B）のログをエージェントに接続し、自律的な研究ワークフローを可能にするオープンソースの CLI ツールおよび Python SDK です。
このプロジェクトは、W&B CLI と MCP を「完全に自律した研究ループ」に活用する際の使い勝手の問題がある、という認識に対処し、遅さや「コンテキスト・ロット（context rot）」の低減を目指しています。
それは、設定とメトリクスのみを分析して W&B のプロジェクトを取り込み、エージェントがサンプリングできる実行（runs）のインデックス付きストアを構築します。
エージェントがインデックスに対してクエリを行うと、Cadenza は上位の成果を出した実験を返し、コンテキストの質を高めます。さらに、探索（exploration）と活用（exploitation）の挙動は設定可能です。
著者はコミュニティからのフィードバックを歓迎しており、導入用として GitHub、ドキュメント、そして PyPI パッケージへのリンクを提供しています（どのエージェントでも利用可能）。

Wandb CLI と MCP は、完全に自律したリサーチループのためのエージェントで使うにはひどく使いにくいです。遅い、もっさりしていて扱いづらく、結果としてコンテキストが劣化（rot）します。

そこで、CLI ツールと Python SDK を作り、あなたの Wandb プロジェクトや実行（runs）を（爪が生えていてもそうでなくても）エージェントに簡単に接続できるようにしました。

CLI ツールは、あなたの wandb プロジェクトをインポートできるようにし、リサーチプロジェクトの解決空間をエージェントが把握しやすい形で実行（runs）の構造を整えることで動作します。

プロジェクトをインポートすると、インデックス作成と実行の保存のために分析されるのは config とメトリクスのみです。エージェントがこのインデックスからサンプルを取得すると、最もパフォーマンスの高い実験だけが返されるため、コンテキスト劣化が抑えられます。また、インデックスとエージェントの挙動を調整して、探索（exploration）と活用（exploitation）のトレードオフを切り替えることもできます。

あらゆるエージェントで使いやすいように、Python SDK と一緒に CLI をオープンソース化しました。

コミュニティからのフィードバックや批評をぜひいただきたいです！

Github: https://github.com/mylucaai/cadenza

Docs: https://myluca.ai/docs

Pypi: https://pypi.org/project/cadenza-cli

提出者: /u/hgarud
[リンク] [コメント]