OpenAI、個人情報保護モデル「Privacy Filter」を公開 商用利用可能な軽量設計

ITmedia AI+ / 2026/4/23

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • OpenAIは、テキスト内の個人識別情報を自動検知・マスキングするオープンウエイトモデル「Privacy Filter」を公開し、AIチャット等に入力する前の削除・保護を支援する。
  • 商用利用・カスタマイズ可能なApache 2.0ライセンスで、Hugging FaceとGitHubに提供される。15億パラメータ規模の軽量設計で、ローカル環境でも動かしやすくデータが外部へ送られるリスクを低減する狙いがある。
  • 文脈を考慮した高スループット検知を特徴とし、private_person/account_number/private_url/private_email/private_phone/private_address/secret/private_dateの8カテゴリを対象とする。
  • 一方で完全匿名化や安全性の保証はなく、ラベル依存のため組織ポリシー適合にはファインチューニングが必要になり得るほか、英語以外や非ラテン文字、地域の命名規則などで性能低下や検出漏れ・過剰マスキングの可能性があり、医療・法務・金融では人のレビュー維持を推奨している。

 米OpenAIは4月22日(現地時間)、テキスト内の個人識別情報を自動検知し、マスキングするオープンウエイトモデル「Privacy Filter」をリリースしたと発表した。データをAIチャットボットなどに読み込ませる前に、個人情報を削除するツールだ。Hugging FaceGitHubで、商用利用やカスタマイズが可能なApache 2.0ライセンスで開発者向けに公開した。

 privacy

 15億パラメータという小規模なモデルなのでローカル環境のWebブラウザやノートPC上でも直接動作し、マスキング処理のためにデータがデバイスの外部へ送信されるリスクを減らせるとしている。

 filter マスキング例(画像:OpenAI)

 開発者がAIをより安全に構築するための実用的なインフラを提供し、ソフトウェアエコシステム全体を支援することを目的として公開したという。OpenAIは、プライバシー保護インフラは誰もが簡単に検査、実行、適応、改善できるべきであるという考えの下、AIが個人ではなく世界を学習できる環境を整えるためにリリースしたと説明している。従来のルールベースの検知ツールが文脈の理解に苦労していたのに対し、Privacy Filterは前後の文脈を考慮した個人情報の検出を高いスループットで行えるとしている。

 このフィルタが検知するのは以下の8つの情報カテゴリだ。

  • private_person:特定の個人を識別する名前、ユーザー名、ハンドルネームなど
  • account_number:クレジットカード番号、銀行口座番号、その他のアカウント識別子
  • private_url:プライベートな共有を意図したWeb URLやIPアドレス、特定の個人を識別するもの
  • private_email:個人的なやり取りに使用される、または特定の個人を識別するメールアドレス
  • private_phone:特定の個人に関連付けられた電話番号
  • private_address:特定の個人に関連付けられた特定の場所や住所
  • secret:APIキー、パスワード、その他の認証情報
  • private_date:生年月日や誕生年など、特定の個人を識別する日時

 公開されたモデルカード(システムカード)では、幾つかの問題点や限界も指摘されている。Privacy Filterは完全な匿名化や安全性を保証するものではなく、過信することはプライバシー保護の目的を損なう恐れがある。また、あらかじめ学習されたラベル分類に依存しているため、組織独自のポリシーに合わせるにはモデルのファインチューニングが必要になる場合がある。

 さらに、英語以外の言語や非ラテン文字、学習データ内で過小評価されている地域の命名規則に対しては、パフォーマンスが低下する可能性も明記されている。珍しい名前の検出漏れや、逆に公開情報などを過剰にマスキングしてしまうエラーも発生し得るため、医療や法務、金融などの機密性の高い分野では、引き続き人間の目によるレビュープロセスを維持することが推奨されている。

関連記事

関連リンク

Copyright © ITmedia, Inc. All Rights Reserved.

続きを読むには、コメントの利用規約に同意し「アイティメディアID」および「ITmedia NEWS アンカーデスクマガジン」の登録が必要です