AI Navigate

弱い手掛かりから実在の身元へ: LLMエージェントにおける推論駆動型脱匿名化の評価

arXiv cs.AI / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、特注のエンジニアリングを要さず、LLMベースのエージェントが限られた手掛かりと公開情報から実世界の身元を再構築するプライバシーリスクとして『inference-driven linkage』を提唱します。
  • この脅威を、三つの設定—古典的リンク(NetflixとAOL)、InferLinkベンチマーク、そして現代のテキスト量が豊富なアーティファクト—にわたり評価し、タスク固有のヒューリスティックを用いなくても、固定プールマッチングとオープンエンドな身元解決の両方を実行できることを示しました。
  • Netflix Prize設定では、エージェントが身元の79.2%を再構築し、古典的なベースラインの56.0%を大幅に上回りました。
  • 敵対的なプロンプトがなくても、善意のクロスソース分析や未構造の語りが副産物としてリンクを生み出す可能性があります。
  • 本研究は、身元推論を第一級のプライバシーリスクとして扱う必要があると主張し、評価はエージェントが推測できる身元を測定するべきだと論じています。

概要:
匿名化は、匿名のレコードを再識別することが歴史的に高コストであり、専門知識、特化したアルゴリズム、手動での裏付け作業を要したため、実務的な保護策として広く扱われてきた。
この障壁を弱める可能性のある成長するプライバシーリスクを研究します:LLMベースのエージェントは、散在し、個別には特定されない手掛かりから、実世界の身元を自律的に再構築できます。
これらの希薄な手掛かりを公開情報と組み合わせることで、エージェントは特注のエンジニアリングを必要とせずに身元を特定します。
この脅威を \emph{推論駆動型結びつき}として形式化し、3つの設定にわたって体系的に評価します:古典的な連携シナリオ(NetflixとAOL)、\emph{InferLink}(タスク意図、共有手掛かり、攻撃者の知識を変化させる制御されたベンチマーク)、および現代のテキストが豊富なアーティファクト。
タスク固有のヒューリスティクスなしに、エージェントは固定プール照合とオープンエンドの身元解決の両方を成功裏に実行します。
Netflix Prize の設定では、エージェントは身元の79.2%を再構築し、古典的なベースラインの56.0%を大幅に上回ります。
さらに、明示的な敵対的プロンプトの下だけでなく、\emph{InferLink} における善意のクロスソース分析や非構造化された研究記述からも、結びつきが生じます。
これらの発見は、アイデンティティ推論 — 単なる明示的な情報開示だけではなく — を第一級のプライバシーリスクとして扱うべきであることを確立します。評価は、エージェントが推測できる身元を測定する必要があります。