AI Navigate

GATechはAbjadGenEval共有タスクに参加: アラビア語機械生成テキスト分類の多言語埋め込み

arXiv cs.CL / 2026/3/12

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 著者らはAbjadGenEval共有タスクに取り組み、アラビア語テキストを人間作成か AI作成かの二値分類のため、多言語E5-largeエンコーダをファインチューニングしました。
  • 彼らは、重み付き層プーリング、マルチヘッドアテンション・プーリング、ゲート付きフュージョンを含む複数のプーリング戦略を比較しましたが、平均プーリングを超えるものは見つかりませんでした。テストセットでの平均プーリングのF1は0.75でした。
  • この結果は、プーリングの複雑さを追加するとパラメータ数とデータ要件が増える一方、単純な平均プーリングは限られたデータでも安定したベースラインを提供し、良く一般化することを示唆しています。
  • 注目すべき観察として、人間が書いたテキストは機械生成テキストよりも著しく長くなる傾向があり、検出の潜在的な言語的手掛かりを示しています。
私たちは、AI生成アラビア語テキストを検出するAbjadGenEval共有タスクへの我々のアプローチを提示します。私たちは、多言語E5-largeエンコーダを二値分類のためにファインチューニングし、トークン表現をプールするためのいくつかのプーリング戦略を検討しました。これには、重み付き層プーリング、マルチヘッドアテンションプーリング、ゲート付きフュージョンが含まれます。興味深いことに、これらのいずれも単純な平均プーリングを上回ることはなく、テストセットでF1=0.75を達成しました。これは、複雑なプーリング手法が訓練に適切な追加パラメータを導入し、より多くのデータを必要とするためだと考えられます。一方、平均プーリングは、限られた例でも一般化が良い安定したベースラインを提供します。データには明確なパターンも観察され、人間が書いたテキストは機械生成テキストよりも著しく長い傾向があることも観察されます。