やあ、r/LocalLLaMA !
ついに新しいモデルが戻ってきました:️ Shield 82M
これはdistilroberta-baseを微調整したバージョンで、あらゆる言語のテキストに含まれるあらゆる種類のPII(個人を特定できる情報)をフィルタリングできます
いくつかの例です:
1) 名前、email、電話でテスト:
Original: 私の名前はジョン・ドウです。Email: john@example.com。Phone: +49 123 45678。
Protected: 私の名前は[PERSON]です。Email: [EMAIL]。Phone: [PHONE]。
2) 基本テスト:
Original: 私はケンブリッジに住んでいます
Protected: 私は[ADDRESS]に住んでいます
3) フランス語テスト(多言語):
Original: Mon e-mail est [jean.dupont@example.fr](mailto:jean.dupont@example.fr) et mon téléphone est +33 6 12 34 56 78。
Protected: Mon e-mail est [EMAIL] et mon téléphone est [PHONE]。
つまり、このモデルは~96%という総合精度で本当にうまく動作していることがわかります。
そして:私の他のすべてのモデルと同様に、完全にオープンソースです。:D
試してみたい場合:https://huggingface.co/LH-Tech-AI/Shield-82M
楽しんでください。:-)
コメント欄でお会いしましょう。ぜひ皆さんからのフィードバックをいただきたいです。
[link] [comments]




