1.2Bモデルが tool calling を拒否する問題を few-shot で突破した話

Zenn / 2026/4/22

💬 オピニオンTools & Practical UsageModels & Research

共有:

要点

1.2B規模のモデルで「tool calling を拒否する」挙動が起きる問題の発生条件と対処の方向性が示されている
few-shot（例示プロンプト）を工夫することで、拒否パターンを回避しツール呼び出しを成立させる実践的な手筋が紹介されている
tool calling の挙動はモデルサイズだけでなく、プロンプトに含める例の与え方で改善しうることが示唆される
実装・運用面では、拒否を減らすためのプロンプト設計（具体例の提示）が有効な改善レバーになる
小規模モデルでも適切なfew-shot設計によりエージェント的な機能（ツール利用）を引き出せる可能性がある

1.2Bモデルが「できません」と言い張る問題を解決した 3行まとめ lfm25-1.2b の tool calling 成功率が 50% しかなく、特に shell 書き込み系は全拒否だった system prompt の強化もツール名の変更も効かず、few-shot 例の注入だけが突破口だった対話履歴に「前に成功した」例を仕込むと、モデルは安心して同じ行動を取ってくれる前回のあらすじ前回の記事で、隣の PC の RTX 2080 で lfm25-1.2b を動かして Hermes Agent に繋いだ。tool calling のテストをしたら、成功率 50%。...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →

Black Hat USA

AI Business

NAVERが開発！韓国語に特化した大規模言語モデル「HyperCLOVA X」

AI-SCHOLAR

東芝、イジングマシンを100倍高速化する新手法組み合わせ最適化で威力

日経XTECH

ソーシャルメディア投稿向けに特化した無料のAI検出アプリ

Reddit r/artificial

BitNet の計算方法を読み解く

Zenn

1.2Bモデルが tool calling を拒否する問題を few-shot で突破した話

要点

関連記事

Black Hat USA

NAVERが開発！韓国語に特化した大規模言語モデル「HyperCLOVA X」

東芝、イジングマシンを100倍高速化する新手法組み合わせ最適化で威力

ソーシャルメディア投稿向けに特化した無料のAI検出アプリ

BitNet の計算方法を読み解く

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat USA

NAVERが開発！韓国語に特化した大規模言語モデル「HyperCLOVA X」

東芝、イジングマシンを100倍高速化する新手法 組み合わせ最適化で威力

ソーシャルメディア投稿向けに特化した無料のAI検出アプリ

BitNet の計算方法を読み解く

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

東芝、イジングマシンを100倍高速化する新手法組み合わせ最適化で威力