CrossTrace:仮説生成のための根拠付き科学的推論トレースを収録した領域横断データセット
arXiv cs.CL / 2026/4/1
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- CrossTraceは、仮説生成のための根拠付き科学的推論トレース1,389件を含む、領域横断データセットとして紹介される。対象領域は生物医学研究、AI/ML、および領域横断の取り組みを含む。
- 各推論トレースは、Input/Trace/Outputのスキーマに従い、HypoGenで用いられているBit-Flip-Sparkフレームワークを拡張して、出典論文テキストに対するステップ単位の根拠付けを行う。
- データセットは8つの発見パターンを定義し、複数領域にまたがるカバレッジを含むことで、領域を越えた仮説生成モデルの評価および訓練を支援する。
- QLoRAを用いてCrossTrace上でQwen2.5-7B-Instructを微調整すると、未調整のベースラインに比べて、判断スコア、構造的遵守性、および類似度指標で大きな改善が得られる。さらに、バランスのとれた領域横断訓練により追加の向上も確認される。
- 150件をサンプリングした記録に対する人手による検証では、ステップ単位の根拠付け精度が99.7%、捏造率が0.0%と報告されており、データセットが掲げる領域一般的な学習価値の主張を裏付ける。




