qwen3.5ではなかったのに、今回次のような問題が起きています。出力の推論部分に引用符(")や一重引用符(')があると、残りを通常の出力として出力し始めます(ただし常にではなく、発生するのは30%の時間です)。
これによりツール呼び出しが壊れることもあり、レスポンスが出力トークンなしでそのまま停止します。
私はWindows上のLM Studioで、RTX5090を使ってqwen3.6-35b-a3bをホスティングしています。推奨の推論設定で、"preserve thinking" は有効です(これを無効にしても改善しません)。OpenWebUI側では、"native functions" が有効になっています。
同様の問題が起きている方はいませんか?
[link] [comments]




