[Qwen Meetup] Qwenによる関数コーリング・ハーネス:6.75%を100%へ

Reddit r/LocalLLaMA / 2026/3/27

💬 オピニオン

要点

  • 話者は、Qwenをベースに構築したFunction Calling Harnessについて説明し、一般に問題になりやすい深く再帰的なユニオン型であっても、関数コーリングを確実に機能させることができたと述べます。
[Qwen Meetup] Function Calling Harness with Qwen, turning 6.75% to 100%

私は個人的にQwenチームから招待を受け、Qwen Meetup Koreaで登壇することになりました。そして昨日、この場で韓国ローカルにて発表できました。直接声をかけてもらえて、かなり光栄でした。

発表内容は、「深く再帰するユニオン型」で関数呼び出しを確実に動かす方法についてでした。業界では一般的に「うまくいかない」と言われている類のものです。qwen3-coder-nextでは、初回の成功率が6.75%でした。そしてQwen 3.5のモデルファミリー全体では、ユニオン型に関して一貫した“二重の文字列化(double-stringify)”のバグにより0%になっていました。どちらも最終的に100%に到達しました。

スライドもこちらで公開されています: https://autobe.dev/seminars/20260326-qwen-meetup-korea.pptx —— もし各スライドの裏にある全体の物語を通して読みたいなら、話者ノートがスライドノート内に書かれています。

TL;DR

  1. AutoBe — AIバックエンドの自動生成エージェント。テキストのコードではなく、関数呼び出しによってASTデータを扱います。4つのASTタイプ + 4段階のコンパイラ検証 + 自己修復ループ。
  2. Typia — 0%を100%に変えるためのインフラ。単一の型で、スキーマ、パーサ、バリデータ、フィードバック生成を自動化します。寛容なJSONパース + 型変換(型の強制) + 正確なバリデーションのフィードバック。
  3. 関数呼び出しを称えて — 型は曖昧さを排除します。スキーマは「禁止」ではなく「不在によって」制約します。モデルに依存せず、機械的に検証可能で、決定論的に収束します。バリデータを備えたあらゆるエンジニアリング領域に適用できます。
  4. Qwen — 小さなモデルが最高のQAエンジニアです。大きなモデルが黙って“帳消し”にしてしまうシステム上の脆弱性をあぶり出します。
  5. 6.75%は失敗ではない — ループへの最初の入力です。 検証できるなら、収束します。

リポジトリ

submitted by /u/jhnam88
[link] [comments]