ScheMatiQ: From Research Question to Structured Data through Interactive Schema Discovery
arXiv cs.CL / 4/13/2026
📰 NewsSignals & Early TrendsTools & Practical UsageModels & Research
Key Points
- ScheMatiQは、自然言語の研究質問と大規模ドキュメント集合から、バックボーンLLMを用いて「抽出のためのスキーマ」と「根拠付きデータベース」を生成する仕組みを提案しています。
- 手作業でのアノテーション設計と網羅的ラベリングに伴う時間的負担やエラーの問題を、Webインターフェースによる対話的なスキーマ探索・修正で緩和することを狙っています。
- 法分野および計算バイオロジーの専門家との協働により、実運用の分析を支える出力が得られることを示しています。
- 本手法はオープンソースとして公開され、Web公開インターフェース、ソースコード、デモ動画などのリソースも提供されています。



