要旨: 科学論文は結果を報告するだけではなく、後の研究がそれらの\textit{claims}を支持し、拡張、あるいは時には反証するように推し進めます。しかし、引用と主張分析の既存の手法は、この対話の断片だけを捉えています。本研究では、これらの相互作用を個々の科学的主張のレベルで明示します。私たちは \texttt{ClaimFlow}、NLP 文献の主張中心の視点を導入します。これは 304 ACL Anthology 論文(1979-2025)から構築され、手動で注釈付けられ、1{,}084 件の主張と 832 件の cross-paper 主張関係を含み、引用論文が \textit{supports}、\textit{extends}、\textit{qualifies}、\textit{refutes}、あるいは主張を \textit{background} として参照するかを示します。\texttt{ClaimFlow} を用いて、- \textit{Claim Relation Classification} - という新しいタスクを定義します。これは、テキストと引用文脈から引用された主張に対する科学的スタンスを推測することをモデルに要求します。強力なニューラルモデルと大規模言語モデルをこのタスクで評価したところ、0.78 の macro-F1 の基準性能を報告します。これは、主張-関係分類が実現可能である一方で困難であることを示しています。さらに、私たちのモデルを約 13k NLP 論文に適用し、数十年にわたる NLP 研究の中で主張がどのように進化するかを分析します。私たちの分析は、63.5% の主張が決して再利用されないことを明らかにします。わずか 11.1% が再挑戦されることのみがあり、一方で広く伝播した主張は、直接的に確認または反証されるよりも、資格付与と拡張を通じて \textit{reshaped} されることが多いです。全体として、\texttt{ClaimFlow} は NLP 内でアイデアがどのように変化し、成熟していくかを検討する視点を提供し、モデルが科学的論証を解釈できるかを評価する基盤を提供します。
ClaimFlow: NLPにおける科学的主張の進化を追跡する
arXiv cs.CL / 2026/3/18
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- ClaimFlowはNLP文献の主張中心の視点を導入し、304件のACL Anthology論文に1,084個の主張と832個の論文間主張関係を注釈付けする。
- 新たなタスク「主張関係分類」を定義し、引用論文が引用された主張に対してどの立場をとっているかをテキストと引用文脈から推定することをモデルに求め、ベースラインのmacro-F1は約0.78である。
- このデータセットは、数十年にわたってNLPの主張がどのように進化してきたかを大規模に分析できることを可能にし、63.5%の主張は再利用されることがなく、わずか11.1%のみが異議を唱えられる。広く伝播した主張は、直接的に肯定・否定されるのではなく、しばしば形を変えて再利用される。
- ClaimFlowはNLPにおける科学的論証を検討する視点を提供し、モデルがこのような論証を解釈できるかを評価する基盤を提供する。




