ローカルLLMにツールアクセスを与えたとき、サンドボックス隔離を実際にどのように保証するのか？

Reddit r/LocalLLaMA / 2026/4/1

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep Analysis

共有:

要点

この投稿は、ローカルLLMにツールアクセスやファイルシステムのマウントを許可することは危険だと主張する。モデルが安全でない操作を幻覚する可能性があるほか、モデルが読み取る外部コンテンツを通じてプロンプトインジェクションされるおそれがあるためだ。
Ant AI Security Labによる最近のOpenClawのセキュリティ監査を引用している。報告によれば、サンドボックスのパラメータ検証を回避することで、フレームワークのメッセージツールをだまし、任意のホスト上のローカルファイルを読み取れることが判明したという。
著者は、検証が敵対的な条件下で失敗し得る場合に、エージェントフレームワーク内蔵のサンドボックス機能に頼るだけで十分なのか疑問を投げかけている。
議論では、実際にローカルのエージェント環境をどのように安全にしているのか、たとえば厳格なDocker設定、専用VM、その他の隔離戦略などを実務者に尋ねている。

たぶんこれはかなり基本的な質問です。でも、ローカルモデルにツール呼び出しアクセスやファイルシステムのマウントを許可することは、本質的に危険であることは分かっています。モデル自身が危険なアクションにハルシネーションしてしまうかもしれませんし、モデルが読み取る外部コンテンツからプロンプトインジェクションを受ける可能性もあります。通常は、エージェントのフレームワークに組み込まれているサンドボックス機構に、すり抜けたものを検知してもらうことに頼っています。

Ant AI Security Labによる最近のOpenClawセキュリティ監査を読んでいて、考えさせられました。彼らは、サンドボックスのパラメータ検証を回避することで、フレームワークのメッセージツールを悪用し、ホストマシン上の任意のローカルファイルを読み取らせることができることを見つけました（参考: https://github.com/openclaw/openclaw/security/advisories/GHSA-v8wv-jg3q-qwpq）。

もしフレームワーク自身のパラメータ検証がこのように失敗し得て、ローカルモデルがプロンプトインジェクションを受けたり暴走したりする可能性があるとしたら、皆さんは実際にローカルのエージェント環境をどのように保護しているのでしょうか？

厳格なDocker設定に依存していますか？専用VMですか？それともフレームワークに組み込まれている隔離機構を信頼しているだけでしょうか？

submitted by /u/Careful_Equal8851
[link] [comments]