1.2Bモデルが tool calling を拒否する問題を few-shot で突破した話
Zenn / 2026/4/22
💬 オピニオンTools & Practical UsageModels & Research
要点
- 1.2B規模のモデルで「tool calling を拒否する」挙動が起きる問題の発生条件と対処の方向性が示されている
- few-shot(例示プロンプト)を工夫することで、拒否パターンを回避しツール呼び出しを成立させる実践的な手筋が紹介されている
- tool calling の挙動はモデルサイズだけでなく、プロンプトに含める例の与え方で改善しうることが示唆される
- 実装・運用面では、拒否を減らすためのプロンプト設計(具体例の提示)が有効な改善レバーになる
- 小規模モデルでも適切なfew-shot設計によりエージェント的な機能(ツール利用)を引き出せる可能性がある
1.2Bモデルが「できません」と言い張る問題を解決した
3行まとめ
lfm25-1.2b の tool calling 成功率が 50% しかなく、特に shell 書き込み系は全拒否だった
system prompt の強化もツール名の変更も効かず、few-shot 例の注入だけが突破口だった
対話履歴に「前に成功した」例を仕込むと、モデルは安心して同じ行動を取ってくれる
前回のあらすじ
前回の記事で、隣の PC の RTX 2080 で lfm25-1.2b を動かして Hermes Agent に繋いだ。tool calling のテストをしたら、成功率 50%。...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →