これのきっかけになった観察:人々が日常的にAIに使っていることの大半――要約、下書き、分類、抽出など――は、実際にはフロンティアモデルを必要としません。まともな8~70Bモデルなら、それらを同じくらいうまくこなします。とはいえ、多くの人は癖で、すべてをClaudeかChatGPTに通してしまいます。
私はこれを自動的に解決するためにFollowloop(followloop.app)を作りました。各タスクを複雑さで分類し、振り分けます:
- 単純なタスク → Cerebras Llama(2000 TPS、1M tokens/日が無料)、Groq、Gemini Flash
- 中程度のタスク → Groq 70B、SambaNova
- 複雑なタスク → フォールバックとしてClaude Haiku
ダッシュボードでは、Claude Sonnetで全部を実行した場合にかかるはずの金額と、あなたの実際のコストが並んで表示されます。私はこれを2週間、自分自身のAIワークフローで運用しています:9,200件のタスクを振り分け、$21.24節約、実際のコストは$0.1360。平均するとSonnetよりトークンあたり約157倍安いです。
MCP(Model Context Protocol)経由で、あらゆるAIセットアップに対応――Claude Desktop、Cursor、Claude Code、またはMCP対応の何でも。
ボーナス機能として、安全性審査済みの1,300+のMCPサーバーのライブラリも付いています。
月$5(followloop.app)
[link] [comments]