1.2Bモデルが tool calling を拒否する問題を few-shot で突破した話

Zenn / 2026/4/22

💬 オピニオンTools & Practical UsageModels & Research

要点

  • 1.2B規模のモデルで「tool calling を拒否する」挙動が起きる問題の発生条件と対処の方向性が示されている
  • few-shot(例示プロンプト)を工夫することで、拒否パターンを回避しツール呼び出しを成立させる実践的な手筋が紹介されている
  • tool calling の挙動はモデルサイズだけでなく、プロンプトに含める例の与え方で改善しうることが示唆される
  • 実装・運用面では、拒否を減らすためのプロンプト設計(具体例の提示)が有効な改善レバーになる
  • 小規模モデルでも適切なfew-shot設計によりエージェント的な機能(ツール利用)を引き出せる可能性がある
1.2Bモデルが「できません」と言い張る問題を解決した 3行まとめ lfm25-1.2b の tool calling 成功率が 50% しかなく、特に shell 書き込み系は全拒否だった system prompt の強化もツール名の変更も効かず、few-shot 例の注入だけが突破口だった 対話履歴に「前に成功した」例を仕込むと、モデルは安心して同じ行動を取ってくれる 前回のあらすじ 前回の記事で、隣の PC の RTX 2080 で lfm25-1.2b を動かして Hermes Agent に繋いだ。tool calling のテストをしたら、成功率 50%。...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →