Gemma 4:私の多言語ツール呼び出しテストで100%を達成した最初のLLM

Reddit r/LocalLLaMA / 2026/4/3

💬 オピニオンTools & Practical UsageModels & Research

要点

  • Redditユーザーが、自身のセルフホスト環境で英語・ドイツ語・日本語にまたがるツール呼び出しにおいて、初めて100%の成功率を達成したLLMとしてGemma 4を報告している。
  • このユーザーの音声アシスタントはn8nとバックエンドツール(例:websearchやMQTT連携)で構築されており、ウェイクワード検出に応じて言語別のコンテキスト、プロンプト、ツール説明を動的に切り替える。
  • ユーザーはデュアル3090+3080構成で、VRAM 68GBの環境において多言語MoEモデルを実行し、リアルタイムのアシスタント挙動のためにレイテンシを低くすることを優先している。
  • 試した過去のモデルやバリアント(いくつかのMoEサイズや他のモデルファミリーを含む)では、3言語すべてに対して同じ一貫性のあるツール呼び出しを達成できなかったと報告されている。
  • ユーザーは、テスト手法における目標とする信頼性に合致したのは、特定の構成であるGemma 4(26B、26BA4B)だと強調している。

私は、Llama 3 が話題になる前から自宅でLLMをセルフホスティングしてきました。そして Gemma 4 は、私のツール呼び出しテストにおいて実際に 100% の成功率を持つ最初のモデルです。

私がLLMを使う主な目的は、N8N を使って構築したカスタムの音声アシスタントで、バックエンドでは websearch やカスタムの MQTT ツールなどのカスタムツールを用いています。大きいのは、私の家庭が多言語だという点で、英語・ドイツ語・日本語を使っています。使用するウェイクワードに基づいて、文脈(コンテキスト)やプロンプト、そしてツールの説明が、その言語に応じて切り替わります。

私の環境は 68GB のVRAM(3090 を2台 + 3080 を 20GB)で、主に遅延を最小化するために moe モデルを使っています。これまで私は、30B の MOE から Qwen Next、GPTOSS、GLM AIR まで色々試してきましたが、ツール呼び出しにおいて3つの言語すべてで 100% の成功率を示したのは Gemma4 26BA4B だけでした。

投稿者: /u/MaruluVR
[リンク] [コメント]