🛡️ Shield 82M:PII(個人情報)を除去・フィルタリングするモデル

Reddit r/LocalLLaMA / 2026/4/25

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • Shield 82Mは、distilroberta-baseを微調整した新しいオープンソースのPIIフィルタリング・モデルで、あらゆる言語のテキストから個人を特定し得る情報を除去することを目的としています。
  • 名前・メールアドレス・電話番号・住所などのセンシティブ情報を、[PERSON]、[EMAIL]、[PHONE]、[ADDRESS]といったプレースホルダーに置き換える仕組みが示されています。
  • 英語の基本テストだけでなくフランス語などの多言語例でも動作し、総合精度は約96%と報告されています。
  • 提供されているHugging Faceのリンクからモデルを試すことができます。
  • 利用者のフィードバックを歓迎する形で、コミュニティでの検証を促しています。

やあ、r/LocalLLaMA !

ついに新しいモデルが戻ってきました:️ Shield 82M

これはdistilroberta-baseを微調整したバージョンで、あらゆる言語のテキストに含まれるあらゆる種類のPII(個人を特定できる情報)をフィルタリングできます

いくつかの例です:

1) 名前、email、電話でテスト:

Original: 私の名前はジョン・ドウです。Email: john@example.com。Phone: +49 123 45678。
Protected: 私の名前は[PERSON]です。Email: [EMAIL]。Phone: [PHONE]。

2) 基本テスト:

Original: 私はケンブリッジに住んでいます
Protected: 私は[ADDRESS]に住んでいます

3) フランス語テスト(多言語):

Original: Mon e-mail est [jean.dupont@example.fr](mailto:jean.dupont@example.fr) et mon téléphone est +33 6 12 34 56 78。
Protected: Mon e-mail est [EMAIL] et mon téléphone est [PHONE]。

つまり、このモデルは~96%という総合精度で本当にうまく動作していることがわかります。

そして:私の他のすべてのモデルと同様に、完全にオープンソースです。:D

試してみたい場合:https://huggingface.co/LH-Tech-AI/Shield-82M

楽しんでください。:-)

コメント欄でお会いしましょう。ぜひ皆さんからのフィードバックをいただきたいです。

submitted by /u/LH-Tech_AI
[link] [comments]