https://huggingface.co/tanaos/tanaos-spam-detection-italian
イタリア語のテキストからスパム内容を認識するために、特に微調整(fine-tuned)された小型のスパム検出モデルです。以下の種類のコンテンツはスパムとみなされます:
- 望まれていない商業広告、または非営利の布教(プロゼリタイジング)。
- 詐欺的な仕組み。いわゆる「すぐに金持ちになれる」詐欺やピラミッドスキームを含みます。
- フィッシングの試み。不自然なオファーや発表。
- 欺瞞的または誤解を招く情報を含むコンテンツ。
- マルウェア、または有害なリンク。
- アダルトコンテンツ、または露骨な素材。
- 注目を集めるための、大文字や句読点の過剰な使用。
使い方
このモデルは Artifexライブラリ を通じて使用します:
以下でArtifexをインストールします:
pip install artifex 以下でモデルを使用します:
from artifex import Artifex spam_detection = Artifex().spam_detection(language="italian") print(spam_detection("Hai vinto un iPhone 16! Clicca qui per ottenere il tuo premio.")) # >>> [{'label': 'spam', 'score': 0.9989}] 想定される用途
このモデルは次のために意図されています:
- テキストがイタリア語である場合に限り、メールシステム、メッセージングアプリ、またはその他のテキストベースの通信プラットフォームに対する、最初の層のスパムフィルタとして機能すること。
- テキストをスパム/スパムでないとして分類することで、不要または有害なメッセージを減らすことに役立つこと。
意図されていない用途:
- 誤分類が、人の追加確認なしで重大な結果につながり得るような、高リスク(high-stakes)なシナリオでの使用。
[link] [コメント]


