強化された議論(引数)分類のためのマルチエージェント弁証法的洗練
arXiv cs.CL / 2026/3/31
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、議論(引数)マイニングにおける限界に取り組む。すなわち、教師あり手法はコストのかかるドメイン固有の微調整を要し、またLLMベースの手法は主張(Claims)と前提(Premises)のような曖昧な構成要素を誤分類し得る。
- 提案手法は、MAD-ACC(Argument Component ClassificationのためのMulti-Agent Debate)であり、不確かなテキストに対して弁証法的な洗練を行うために、提唱者(Proponent)–反対者(Opponent)–審判(Judge)のマルチエージェント構成を用いる。
- エージェントに反対の解釈をそれぞれ擁護させ、その後に裁定させることで、単一エージェントの自己修正でしばしば生じる構造的曖昧性の誤りを減らし、迎合(sycophancy)も緩和する。
- UKP Student Essaysコーパスでの実験により、MAD-ACCはMacro F1 85.7%を達成し、単一エージェントの推論ベースラインを上回る一方で、ドメインに対して学習不要(training-free)であることが示される。
- 本フレームワークは、分類判断を正当化する人間が読める「討論(debate)」のトランスクリプトを生成するため、ブラックボックス分類器よりも説明可能であると位置付けられている。




