抄録: 本稿では、医用画像セグメンテーションの科学分野における完全自律型研究のためのシステム Camyla を提示する。Camyla は、生データセットを、人手を介さずに、文献に裏付けられた研究提案、実行可能な実験、ならびに完全な原稿へと変換する。長い地平にわたる自律的な実験には、相互に関連した 3 つの課題がある。すなわち、探索の努力が有望でない方向へとドリフトすること、文脈が蓄積されるにつれて先行試行から得られた知識が劣化すること、そして失敗からの回復が反復的な漸進的修正へと崩壊することである。これらの課題に対処するため、システムは 3 つの結合した仕組みを組み合わせる。競合する提案間で努力を割り当てるための「品質重み付き分岐探索」、複数の粒度で試行間の知識を保持・圧縮するための「層状の省察的メモリ」、および、十分に成果が出なかった試行の後の回復を多様化するための「発散的診断フィードバック」である。本システムは、CamylaBench で評価される。CamylaBench は、2025 年の出版物のみから構築された汚染ゼロのベンチマークであり、31 データセットから成る。2 つの独立した実行にまたがって、合計 28 日、8-GPU クラスタ上で、厳格なゼロ介入プロトコルを適用する。2 つの実行において、Camyla は 2,700 件を超える新規のモデル実装と、40 本の完全な原稿を生成し、さらに 14 の確立されたアーキテクチャから選択された、最も強力なデータセットごとのベースライン(nnU-Net を含む)を、それぞれ同一の学習予算のもとで 31 データセット中 22 件および 18 件で上回る(和集合: 24/31)。上級の人間の査読者は、生成された原稿を、現代の医用画像ジャーナルの T1/T2 境界で採点する。自動化されたベースラインと比較して、Camyla は集計されたセグメンテーション性能において AutoML および NAS システムを上回り、さらに 6 つ以上のオープンエンドな研究エージェントに対して、タスク完了とベースライン超えの頻度の両方で上回る。これらの結果は、医用画像セグメンテーションにおいて領域規模の自律型研究が実現可能であることを示唆している。
Camyla:医用画像セグメンテーションにおける自律的研究のスケーリング
arXiv cs.AI / 2026/4/14
📰 ニュース
要点
- Camyla は、医用画像セグメンテーションのデータセットを、文献に基づく研究提案、実行可能な実験、そして完成した原稿へと変換する、完全に自律したシステムとして提示されており、人間の介入なしに実現します。