
AIエージェントは、いわゆる「スキル」を通じて専門知識にアクセスできるはずです。スキルとは、必要に応じてその場で呼び出せるモジュール式の指示のことです。しかし、現実世界のスキル34,000件をテストした研究では、こうした強化は現実的な条件下ではほとんど役に立たないことがわかりました。弱めのモデルは、スキルがない場合よりもむしろスキルを使うほうが成績が悪くなります。
この記事Agent skills look great in benchmarks but fall apart under realistic conditions, researchers findはThe Decoderで最初に掲載されました。




