AI Navigate

カテゴリ化された嫌がらせコンテンツに対するエージェントベースのユーザー適応フィルタリング

arXiv cs.AI / 2026/3/17

📰 ニュースModels & Research

要点

  • 本論文は、オンラインソーシャルネットワークにおける分類済みの嫌がらせコンテンツを個別化してフィルタリングするためのエージェントベースのフレームワークを提案している。
  • エージェントはユーザーフィードバックから学習し、攻撃的、暴言的、憎悪的という各カテゴリに対してフィルタリング閾値を適応させ、個々の許容度を反映する。
  • 著者らは、監視付き分類技術とシミュレートされたユーザーインタラクションを用いてこの手法を実装・評価し、静的モデルに比べて精度とユーザー満足度が向上することを示した。
  • 本研究は、エージェントベースのパーソナライズがデジタル社会環境におけるコンテンツモデレーションを強化しつつ、ユーザーの自律性を維持する方法を強調している。

要約: 私たちはオンラインソーシャルネットワークにおける分類された嫌がらせ的なコミュニケーションの個別フィルタリングのためのエージェントベースのフレームワークを提案します。統一的なフィルタリングルールを適用するグローバルなモデレーションシステムとは異なり、私たちのアプローチは適応的なフィルタリングエージェントを通じてユーザー固有の許容レベルと好みをモデル化します。これらのエージェントはユーザーフィードバックから学習し、攻撃的、虐待的、そして憎悪的な内容を含む複数の嫌がらせカテゴリにわたってフィルタリングしきい値を動的に調整します。私たちは教師あり分類技術と模擬的なユーザー相互作用データを用いてフレームワークを実装・評価します。実験結果は、適応的なエージェントが静的モデルと比較してフィルタリングの精度とユーザー満足度を向上させることを示しています。提案されたシステムは、エージェントベースの個別化がデジタル社会環境におけるコンテンツモデレーションを強化しつつユーザーの自治を維持する方法を示しています。