🛡️ Shield 82M：PII（個人情報）を除去・フィルタリングするモデル

Reddit r/LocalLLaMA / 2026/4/25

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Shield 82Mは、distilroberta-baseを微調整した新しいオープンソースのPIIフィルタリング・モデルで、あらゆる言語のテキストから個人を特定し得る情報を除去することを目的としています。
名前・メールアドレス・電話番号・住所などのセンシティブ情報を、[PERSON]、[EMAIL]、[PHONE]、[ADDRESS]といったプレースホルダーに置き換える仕組みが示されています。
英語の基本テストだけでなくフランス語などの多言語例でも動作し、総合精度は約96%と報告されています。
提供されているHugging Faceのリンクからモデルを試すことができます。
利用者のフィードバックを歓迎する形で、コミュニティでの検証を促しています。

やあ、r/LocalLLaMA !

ついに新しいモデルが戻ってきました：️ Shield 82M

これはdistilroberta-baseを微調整したバージョンで、あらゆる言語のテキストに含まれるあらゆる種類のPII（個人を特定できる情報）をフィルタリングできます

いくつかの例です：

1) 名前、email、電話でテスト：

Original: 私の名前はジョン・ドウです。Email: john@example.com。Phone: +49 123 45678。
Protected: 私の名前は[PERSON]です。Email: [EMAIL]。Phone: [PHONE]。

2) 基本テスト：

Original: 私はケンブリッジに住んでいます
Protected: 私は[ADDRESS]に住んでいます

3) フランス語テスト（多言語）：

Original: Mon e-mail est [jean.dupont@example.fr](mailto:jean.dupont@example.fr) et mon téléphone est +33 6 12 34 56 78。
Protected: Mon e-mail est [EMAIL] et mon téléphone est [PHONE]。

つまり、このモデルは~96%という総合精度で本当にうまく動作していることがわかります。

そして：私の他のすべてのモデルと同様に、完全にオープンソースです。:D

試してみたい場合：https://huggingface.co/LH-Tech-AI/Shield-82M

楽しんでください。:-)

コメント欄でお会いしましょう。ぜひ皆さんからのフィードバックをいただきたいです。

submitted by /u/LH-Tech_AI
[link] [comments]

Black Hat USA

AI Business

半導体、競争の舞台は宇宙へ

日経XTECH

製造業に土木、デジタルツインは机上の空論か「データ同化」で打破

日経XTECH

アクセンチュアとSAPがERP導入で協業、中堅以下の未開拓顧客へAI訴求

日経XTECH

Runway AI動画ジェネレーター：開発者向け実用ワークフロー

Dev.to

🛡️ Shield 82M：PII（個人情報）を除去・フィルタリングするモデル

要点

関連記事

Black Hat USA

半導体、競争の舞台は宇宙へ

製造業に土木、デジタルツインは机上の空論か「データ同化」で打破

アクセンチュアとSAPがERP導入で協業、中堅以下の未開拓顧客へAI訴求

Runway AI動画ジェネレーター：開発者向け実用ワークフロー

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat USA

半導体、競争の舞台は宇宙へ

製造業に土木、デジタルツインは机上の空論か 「データ同化」で打破

アクセンチュアとSAPがERP導入で協業、中堅以下の未開拓顧客へAI訴求

Runway AI動画ジェネレーター：開発者向け実用ワークフロー

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

製造業に土木、デジタルツインは机上の空論か「データ同化」で打破