ローカルのツール呼び出し、本当に使えてます？それとも誰かの集団ジョーク？

Reddit r/LocalLLaMA / 2026/4/19

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisTools & Practical Usage

共有:

要点

Redditの投稿者は、Docker上でOpen WebUIを動かし、LM Studio経由でモデルを使う環境でローカルのツール呼び出しが安定して動かないと報告しています。
複数のモデル（Qwen3.5/Qwen3.6やGemma4など）で結果が不安定で、存在しないはずのファイルやフォルダを作成したように「作った」と断言したり、依頼したHTMLサイトが完成したかのようにでっち上げたりする現象を観測しています。
また、タスクを完了せずに「executing」ループに張り付いているような挙動も指摘しています。
投稿者は、大きなコンテキストを押し込まず、複雑な依頼もしていないことを前提に、これらが小型ローカルモデルの現在の限界なのか、それとも設定ミスなのかを質問しています。
全体として、この投稿はローカルのツール呼び出しをめぐるコミュニティの称賛が現実の信頼性と一致しているのか疑問を投げかけています。

何が悪いのか分からないのですが、私がひどく間違ったことをしているのか、それとも何なのか。ただ、LM Studioのモデルを使ってDocker上でTerminal付きのOpen WebUIを動かしていて、コミュニティがツール呼び出し機能を褒め続けているのは、たぶんやけくそで受け止めるためなんだろうなと思えてきました（笑）

Qwen3.5 27B、35B、Gemma4 26B、Qwen3.6 35B、GPS-OSS 20B――全部試しました。Unslothで推奨されているパラメータも使って、データを1つのファイルとして作ってもらうように頼んだのですが、動くときはあるものの、とにかく挙動が非常に繊細です。

今日はGemma4で、フォルダとファイルを作ったとずっと言い続けてくるのに、実際には何も存在していませんでした。Qwen3.6は、空の .html ファイルが、私が求めた現代的なWebサイトであり、生産（本番）に向けて準備ができているのだと信じ込ませるようにガスライティングしてきました。もし幻覚ではないなら、executing（実行）のループに詰まっているだけなのでしょう。

私はコンテキストを押し込んでいるわけではありません（普通のプロンプトを2〜3個だけですし）、曖昧にしたり、何か複雑なことを頼んだりもしていません。これは単に小型ローカルモデルの現状の制限なのでしょうか？それとも、私は特別に何か致命的なことをやっているのでしょうか？

投稿者 /u/Mayion
[link] [comments]