AnthropicはClaudeにお金遊びをさせたいとして、金融エージェントを解き放つ
常に誤差逆伝播に賭けろ
これまでにClaudeが生成する応答には誤りが含まれる可能性がある、というAnthropicの免責事項を読んだことがあるなら、「それなら財務オペレーションを盛り上げるにはちょうどいいのでは」と思ったかもしれませんね。運がいいです。
Anthropicは、同社のClaude AIサービスが金融関連のタスクをよりうまく支援できるようにするための、金融エージェントのテンプレート一式をリリースしました。
「各エージェントのテンプレートは、3つのものをまとめた参照アーキテクチャです。つまり、スキル(そのタスクのための指示とドメイン知識)、コネクタ(タスクが実行されるデータへの統制されたアクセス)、サブエージェント(比較対象の選定や手法のチェックといった特定のサブタスクのために、メインエージェントによって呼び出される追加のClaudeモデル)です」と同社は説明しています。
用語は少し分かりにくいかもしれません。結局のところ、すべてはツールやデータのようなリソースを使った反復ループの中で、あるゴールを追いかける「モデル」であるからです。
Claude Codeそのものは、Anthropicが定義した制御フローを使って、基盤となるモデルを支えるエージェント的なハーネスです。Claudeモデルがゴールへ向けて制御フローを動かしていく――どのツールを使うか、どのデータにアクセスするかを決める――のであれば、それはエージェントです。
そしてサブエージェントがあります。こちらは、オーケストレーションシステムが提供するコンテキストに加えて、専門化されたシステムプロンプトと指定されたツールを使ってClaudeを呼び出すAPI呼び出しに過ぎません。アプリケーションの特定の側面を扱う、プログラム内の関数のようなものだと言えます。
つまり、Anthropicの金融エージェントは次の構成要素から成ります。タスクのワークフローを説明するMarkdownファイルであるスキル、外部サービスとの連携であるコネクタ、そして、焦点を当てたシステムプロンプト、特定のツール、コンテキストデータから成るサブエージェントです。
たとえば、Anthropic の「Know-Your-Customer Screener」エージェントテンプレート(kyc-screener)には、解析済みのオンボーディング記録に対して、Claude が企業の KYC/AML(マネーロンダリング防止)ルールをどのように適用すべきかを明文化した kyc-rules というスキルが含まれています。ルールは、AI モデルに対してリスク評価の割り当て、書類の確認、ルール結果の引用、そして結果を次の形式で作成するよう指示しています:
この JSON データは、それを受け取るあらゆる企業システムにとって有用だろうと思われます。
{
"risk_rating": "low | medium | high",
"disposition": "clear | request-docs | escalate-EDD | decline-recommend",
"missing_documents": ["..."],
"escalation_reasons": ["rule 4.2: confirmed PEP", "..."],
"rule_outcomes": [{"rule_id": "...", "outcome": "...", "evidence": "..."}]
}
Anthropic のエージェント一覧には、Pitch builder(ピッチ作成者); Meeting preparer(会議準備者); Earnings reviewer(決算レビューア); Model builder(モデル作成者); Market researcher(市場調査者); Valuation reviewer(バリュエーション・レビュアー); General ledger reconciler(総勘定元帳の突合者); Month-end closer(月末締め担当); Statement auditor(ステートメント監査者); そして前述の通り KYC screener(KYC スクリーナー)があります。
これらは、Claude Cowork や Claude Code に対してプラグインとして、あるいは Claude Managed Agents 向けの「cookbook」(コピー可能なコードスニペット)として適用できます。
あなたは、財務分野は数字のような“サイエンス寄りのもの”になるとかなり容赦がない傾向があると思っているかもしれません。おそらく、Anthropic の Opus 4.7 モデルが Vals AI の Finance Agent ベンチマーク で「業界トップクラス」とされる 64.37 パーセントを記録したことには、納得できないかもしれません。つまり人間なら放り出されてしまうような失敗率です。
心配はいりません。というのも Anthropic は、ユーザーが「しっかりとループの中にとどまり――クライアントに渡される前、提出される前、あるいは実行される前に――Claude の作業をレビューし、改善を反復し、承認する」ことを期待しているからです。
会計には責任がつきものです。®




