インコンテキスト・プライミングによる推論時セマンティック汚染（Emergent Inference-Time Semantic Contamination）

arXiv cs.CL / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLMが「推論時セマンティック汚染（inference-time semantic contamination）」を示し得ることを論じており、特定のfew-shot例を注入すると、その後の意味的に無関係なプロンプトにおいて、測定可能な分布シフトが生じるとされる。
k-shotプロンプトのみでは不十分だという先行主張を再検討し、その効果が起こり得る一方で、それがモデルの能力に依存することを示す。より高機能なモデルほどドリフトが強くなる。
制御された設定で、文化的に負荷のかかった5つの数値をデモとして用いたところ、著者らは、高能力モデルではより暗く、権威主義的で、またスティグマ化されたテーマへのシフトが観測される一方、より単純／小規模なモデルでは有意な効果が見られないことを確認した。
本研究ではさらに、構造的に不活性なデモ（ナンセンス文字列）であっても出力分布を摂動し得ることを見出し、2つの機構――「構造・フォーマット汚染」と「意味内容の汚染」――が示唆される。
著者らは、汚染が生じる条件の境界を整理し、few-shotプロンプトに依存するLLMアプリケーションに対する直接的なセキュリティ上の含意を強調する。

要旨: 近年の研究により、不正確なコードや文化的に負荷のかかった数値コードに対して大規模言語モデル（LLM）を微調整すると、創発的なミスアラインメントが生じ、無関係な下流タスクにおいて有害な内容を生成することがあることが示されました。これに関わった著者らは、その効果は $k$ ショットのプロンプトだけでは誘発されないと結論づけています。私たちはこの結論を改めて検討し、推論時の意味ドリフトが実在し、かつ測定可能であることを示します。ただし、それには十分に大きな能力を持つモデルが必要です。5つの文化的に負荷のかかった数値を、意味的に無関係なプロンプトの前に少数ショットのデモンストレーションとして注入する、制御された実験を行ったところ、文化的連想をより豊かに表現できるモデルでは、より暗く、権威主義的で、かつスティグマ（烙印）を伴うテーマへの有意な分布のシフトが見られました。一方で、より単純／より小型のモデルではそれが見られませんでした。さらに、構造的に不活性なデモンストレーション（ナンセンスな文字列）が出力分布を攪乱することも分かりました。これにより、2つの切り離されたメカニズム、すなわち「構造フォーマットの汚染」と「意味内容の汚染」が示唆されます。本研究は、推論時の汚染が生じる境界条件を整理し、少数ショットのプロンプトを用いるLLMベースのアプリケーションのセキュリティに対して直接的な含意をもたらします。

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/7Dailyインサイトを見る →

Black Hat Asia

AI Business

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

日経XTECH

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

日経XTECH

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

日経XTECH

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

日経XTECH

インコンテキスト・プライミングによる推論時セマンティック汚染（Emergent Inference-Time Semantic Contamination）

要点

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

テスラの巨大AI半導体工場、インテル参画 テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造 ラピダスに出資「連携深める」

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

テスラの巨大AI半導体工場、インテル参画テラファブ「製造技術を刷新」

エプソン、インクジェットで半導体製造ラピダスに出資「連携深める」