CRISP：学術出版物の相対的インパクトを特徴づける

arXiv cs.CL / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLMを用いて引用元論文内で引用されている全ての文献を共同で順位付けし、引用を個別に評価するのではなく相対的なインパクト比較を可能にする手法CRISPを提案する。
LLMの位置（バイアス）を抑えるために、CRISPはランダム化した順序で3回ランキングを繰り返し、多数決で結果を集約する。
CRISPは従来の最先端のインパクト分類器より改善し、人手で注釈された引用データセットで精度+9.5%、F1+8.3%を達成する。
このアプローチは、必要なLLM呼び出し回数を減らすことで効率化が図られており、オープンソースのモデルでも競争力のある性能で動作でき、スケーラブルかつ低コストな分析を支援する。
著者らは、生成したランキング、インパクトラベル、およびコードベースを公開し、引用インパクトの特徴づけに関する追随研究を促進する。

Abstract

引用された論文の影響度を評価することは通常、引用する論文の中での引用文脈を、それ自体の範囲内で解析することで行われます。これにより最も直接的に関連するテキストに焦点を当てられる一方で、ある論文が引用している全ての文献にまたがる相対的な比較が妨げられます。私たちは、その代わりに大規模言語モデル（LLMs）を用いて、引用する論文の中で言及されている全ての引用論文を共同で順位付けするCRISPを提案します。LLMの位置バイアスを軽減するために、各リストをランダムな順序で3回ずつ並び替えた上で順位付けし、多数決によって影響ラベルを集約します。この共同アプローチは、引用を独立に評価するのではなく、引用文脈全体を活用することで、影響のある参照をより確実に識別することを可能にします。CRISPは、人手で注釈された引用からなるデータセットにおいて、従来の最先端の影響度分類器に対して精度で+9.5%、F1で+8.3%上回ります。CRISPはさらに、LLM呼び出し回数を減らすことで効率性も向上し、オープンソースのモデルとも競争力のある性能を示します。これにより、大規模でコスト効率の高い引用の影響度分析が可能になります。私たちは、今後の研究を支えるために、順位付け結果、影響ラベル、コードベースを公開します。

5分の指示で「5時間働く」TANRENのAIエージェント、労働時間の常識激変

日経XTECH

[D] 分散型プルーフ・オブ・ワーク計算は、ニューラルネットワーク学習のための協調（コーディネーション）要件をどのように扱うのか？

Reddit r/MachineLearning

BYOKは単なる料金モデルではない：AIプロダクトの信頼を変える理由

Dev.to

AIによる引用レジストリと、記録間におけるアイデンティティの持続性

Dev.to

Google Gemini 3.1 Flash Live と VideoSDK でリアルタイムAIボイスエージェントを構築する

Dev.to

CRISP：学術出版物の相対的インパクトを特徴づける

要点

Abstract

関連記事

5分の指示で「5時間働く」TANRENのAIエージェント、労働時間の常識激変

[D] 分散型プルーフ・オブ・ワーク計算は、ニューラルネットワーク学習のための協調（コーディネーション）要件をどのように扱うのか？

BYOKは単なる料金モデルではない：AIプロダクトの信頼を変える理由

AIによる引用レジストリと、記録間におけるアイデンティティの持続性

Google Gemini 3.1 Flash Live と VideoSDK でリアルタイムAIボイスエージェントを構築する

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer