多くのエージェントフレームワークは見落としている：スキルとは「何を表すか」と「どう実行するか」の違い

Reddit r/artificial / 2026/4/21

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

この記事は、多くのエージェント「スキル」フレームワークが2つの異なる次元、つまり「スキルが何を表すか（ペルソナ・ツール・ワークフロー）」と「どう実行するか（ステートレス／ステートフル）」を混同していると主張しています。
ステートレスなスキルはリトライや並列化がしやすい一方、ステートフルなスキルは副作用や実行順序の制約を生み、追加の構造が必要になると説明します。
読み取り系ツールと書き込み系ツール、分析と公開（パブリッシュ）のように影響の性質が違うツール／ワークフローは、実運用では根本的に挙動が異なる点を指摘しています。
ステートフルな実行を扱うために、チェックポイント、サイドエフェクト（副作用）の明示的な処理、必要に応じて実行前のドライラン手順を加えることを推奨しています。
中心となる考え方として、スキルは「何を表すか」と「どう実行するか」の“掛け算”として設計すべきだと提案し、他の人がエージェントのワークフローをどう構造化しているかを問いかけています。

私は、エージェントシステムにおける「スキル」の構造化について、どのように考えればよいかをずっと考えてきました。

さまざまなフレームワークでは、「スキル」はとても異なる意味を持ちえます：

しかし、実際にはここに2つの別々の問いがあります：

スキルは何を記述しているのか？

どのように実行されるのか？

ほとんどのフレームワークはこれらを混ぜ合わせています。

それはデモではうまくいきます——しかし実運用のシステムでは壊れ始めます。

例えば：

ステートフルなステップが関わってくると、より多くの構造が必要になります：

簡単に考える方法：

→ スキル = （何を記述しているか）×（どのように実行するか）

他の人たちがこれをどう考えているのか気になります。

エージェントのワークフローにおいて、この2つの次元を明示的に区別していますか？

note

note

note

note

note