Qwen 3.5 のテンプレーティングロジックをかなり徹底的に深掘りして、残り続けているツール呼び出しのバグを正しく直しました。こちらの方々は本当に素晴らしい土台を作っていて、@pneuny や @ellary のような方々によるテンプレートは、初期の段階で本当に命の恩人でした。ですが、多くのものが強制的なプロンプトインジェクションに依存していたり、xml のフォーマットをうっかり幻覚(誤認)してしまったりすることに気付きました(qwen は実際には、古いテンプレートがフォールバックしてしまう /* 記法ではなく、ネイティブに純粋な <think> タグで学習されています)。
そこで、公式の qwen テンプレートに存在する既知の問題点をすべて洗い出して、何時間も調査・テストした後、私は可能な限り最高のテンプレートを慎重に作成しました。これはネイティブの xml スキーマを完全に尊重し、現代の API クライアントが使う新しい 'developer' ロール文字列を動的にマッピングし、空のツールパラメータを安全にキャッシュします。
補足として、LM Studio を特に使っている方へ:バックエンドは python の |items 辞書イテレータでエラーを投げます。また、モデルが思考の中でツール呼び出しについて考えるだけでも、正規表現パーサが完全に壊れてしまいます。私は、この jinja に対して的を絞った修正を統合しました。プロンプト内(システムでもユーザーでも)どこかに <|think_off|> と書けば、テンプレートがタグを見えない形でスクラブし、そのターンにおける思考を完全にハード無効化することで、無限ループのツールバグを完全に回避します。
ここでのアーキテクチャが、近々リリース予定の Qwen 3.6 モデルでも引き続き有効であるのに十分な堅牢さだといいのですが。奇妙な挙動に遭遇したら教えてください。
テンプレートはこちらから入手できます:
[link] [comments]




