CHAIRO:LLMのための文脈的階層的類推誘導と推論最適化

arXiv cs.AI / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、文脈的階層的類推誘導を用いて規則誘導と判断の信頼性を高める、新しいLLMベースのコンテンツモデレーションフレームワーク「CHAIRO」を提案する。
  • 静的な規則に依存するのではなく、CHAIROは類推検索、規則生成、モデレーション分類をエンドツーエンドで最適化し、多様で曖昧なユーザー生成コンテンツに対して動的に適応する。
  • 実験の結果、CHAIROは、規則を注入した微調整ベースラインおよび多段階の静的RAGパイプラインと比べて、モデレーション精度と生成されるモデレーション規則の質の両面で大幅に上回ることが示された。
  • 著者らは、人手による評価と外部モデルの汎化テストにより、このアプローチを裏付けており、生成された規則の明瞭性、解釈可能性、ならびに実運用での適用可能性の向上を報告している。

Abstract

オンライン・プラットフォームにおけるコンテンツモデレーションは、ユーザー生成コンテンツの複雑性が進化し続けることや、従来のルールベースおよび機械学習アプローチの限界により、依然として困難が持続しています。近年、大規模言語モデル(LLM)の進歩によって、直接プロンプトやファインチューニングによるより洗練されたモデレーションが可能になりましたが、これらの手法はしばしば、未見または曖昧なケースに対する一般化性、解釈可能性、適応性が限定的です。 本研究では、ルール誘導と意思決定の信頼性を高めるために、類比(アナロジー)の例を活用する新しいモデレーション枠組みを提案します。我々のアプローチは、類比的検索、ルール生成、モデレーション分類のエンドツーエンド最適化を統合し、多様なコンテンツ状況に応じてモデレーション・ルールを動的に適応可能にします。包括的な実験により、本手法がモデレーション精度とルールの質の観点で、ルールを注入したファインチューニングのベースラインと多段階の静的RAGパイプラインの両方を大幅に上回ることを示します。さらに、人手評価や外部モデルによる一般化テストを含む追加評価によって、本枠組みがより明確で、解釈可能で、適用性の高いルールを生成することが確認されます。これらの結果は、類比の例に基づく手法が、現実のアプリケーションにおいて、堅牢で説明可能かつ一般化可能なコンテンツモデレーションを前進させ得ることを示しています。