LM StudioのLLMは、いまやインターネットから画像を取得してそれを見たり、あなたに見せたりできるようになりました

Reddit r/LocalLLaMA / 2026/3/25

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • 開発者がLM Studio向けのプラグインを公開し、ローカルLLMがWebから画像を取得して、チャットのワークフロー内でビジョンベースの分析に利用できるようにしました。
  • 設定はLM Studioのプラグイン対応により「1クリック」で行えることを想定しており、ビジョン対応モデル(例:Qwen 3.5のvision系バリアント)が必要です。
  • 更新されたDuck-Duck-Goおよび「Webサイトを訪問」タイプのプラグインは、チャットへの埋め込みをしやすくするためにサムネイルを生成して画像を扱えるようになり、混雑を減らしつつ、可能な場合は高解像度の画像を分析に使用します。
  • これらのプラグインは、LLMに対して画像を直接埋め込むか、ユーザーが多数の画像を求めた場合にMarkdownのギャラリー/テーブルとして提示するかを導くことで、より柔軟なマルチモーダル応答を可能にします。
  • 投稿では、ツール呼び出しのエラーを最小限に抑え、生成挙動(サンプリングや反復の制御)を改善することを意図した、プラグインのリンク例とプロンプト/テンプレートのガイダンスが共有されています。
LM Studio の LLM は、いまインターネットから画像を取得してそれを見ること/あなたに見せることができるようになりました

やあ、LM Studio 内の LLM が分析のために、Web から画像を取り込めるようにするプラグインを作りました。タスクに応じてツールをチェーンして使います。

MCP/APIs/Registration は不要——これは LM Studio の Web サイトから 1 クリックでインストールできるシンプルなスクリプトです。(はい、LM Studio にはプラグイン対応があります!)必要なのはビジョン対応のモデルだけです(Qwen 3.5 9b / 27b はどちらもおすすめです)。

さらに、Duck-Duck-Go と Visit Website の各プラグインも画像に対応するよう更新し、追加機能も入れました:

  • ツールは自動で画像を取得し、チャットへの埋め込み用に小さめのサムネイル(thumb)へ変換します(ごちゃつきを避けるためです)。
  • 分析ツールは、可能であれば高解像度の画像を使って解析します。
  • プラグインは、必要なら LLM に画像を埋め込ませます。あるいは、ユーザーが大量の画像を明示的に求める場合は、Markdown のテーブルギャラリーを使うよう誘導します。

スクリーンショットでは、この仕組みの例をいくつか見ることができます。

リンク:
https://lmstudio.ai/vadimfedenko/analyze-images
https://lmstudio.ai/vadimfedenko/duck-duck-go-reworked
https://lmstudio.ai/vadimfedenko/visit-website-reworked

必要な人がいるかもしれないので、私の Jinja プロンプトテンプレート:Pastebin(こちらでツール呼び出しエラーの問題が解決しました)
私の Qwen 3.5 の設定(基本的に公式の Qwen 推奨):
温度(Temperature):1
Top K サンプリング:20
リピートペナルティ(Repeat Penalty):1
Presence Penalty:1.9(これが重要だと思います。私の場合、この値で繰り返しの問題が解消され、ループから抜け出せるようになります)
Top P サンプリング:0.95
Min P サンプリング:0

システムプロンプト:
あなたは有能で、思慮深く、正確なアシスタントです。常に、真実であること、ニュアンスのある理解、洞察に富むこと、そして効率性を優先し、回答はユーザーのニーズと好みに合わせて具体的に調整してください。

質問に答える前に調査してください:推論とツール呼び出しの両方を使って、適切な結論を導き出します。

Link 前回の投稿

submitted by /u/Agreeable_Effect938
[link] [comments]