SemEval-2026 Task 6 における CSE-UOI: 政治的回避検出のための熟議的複雑性ゲーティングを用いた二段階の異種アンサンブル

arXiv cs.CL / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、自己一貫性と加重投票を用いた二段階の異種LLMアンサンブルを提示し、政治的インタビューの回答を「明確な回答」「曖昧」「明確な未回答」の3つに分類します。
Deliberative Complexity Gating (DCG) を導入し、モデル間の挙動信号と応答長の代理指標を活用してサンプルの曖昧さを検出し、推論をゲートする事後補正機構です。
本研究はまた、推論能力を高める代替戦略としてマルチエージェント・ディベートを評価し、DCG が単にモデル数を増やすのではなく推論を適応的にゲートする点と対比させます。
本手法は SemEval-2026 Task 6 で Macro-F1 スコア 0.85 を達成し、評価セットで 3 位を確保しました。

要約: 本論文は SemEval-2026 Task 6 のための私たちのシステムを説明します。これは、政治的インタビューにおける回答の明瞭さを三つのカテゴリに分類します：明確な回答、あいまい、そして明確な非回答。私たちは、自己整合性（SC）と加重投票を介した異種のデュアルLLMアンサンブル、および新しい事後補正機構 Deliberative Complexity Gating（DCG）を提案します。この機構は、モデル間の挙動信号を利用し、LLMの応答長さの代理指標がサンプルの曖昧さと強く相関するという事実を活用します。あいまいさ検出を改善する仕組みをさらに検討するために、多エージェント討論を、熟議能力を高める代替戦略として評価しました。DCGとは異なり、クロスモデルの挙動信号を用いて推論を適応的にゲートするのではなく、討論はモデルの多様性を増やすことなくエージェント数を増やします。私たちの解法は評価セットで Macro-F1 スコア0.85 を達成し、3位を確保しました。
返却形式: {"translated": "翻訳されたHTML"}

生成AIが「下手な鉄砲」型サイバー攻撃を増やす、足元固めを急ごう

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

NEC、「暗黙知」をAIで可視化—危険の予兆を映像から検出し、改善アドバイスを自動生成する技術を世界初開発

Innovatopia

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

Qiita

AI生成で児童性的虐待をリアルに描写した画像・動画は前年比14％増の8029件確認されたという報告、特に動画件数は1年で260倍以上も増加

GIGAZINE

SemEval-2026 Task 6 における CSE-UOI: 政治的回避検出のための熟議的複雑性ゲーティングを用いた二段階の異種アンサンブル

要点

関連記事

生成AIが「下手な鉄砲」型サイバー攻撃を増やす、足元固めを急ごう

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

NEC、「暗黙知」をAIで可視化—危険の予兆を映像から検出し、改善アドバイスを自動生成する技術を世界初開発

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

AI生成で児童性的虐待をリアルに描写した画像・動画は前年比14％増の8029件確認されたという報告、特に動画件数は1年で260倍以上も増加

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer