Knows：エージェントネイティブな構造化リサーチ表現

arXiv cs.AI / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

この論文では、研究論文に対して主張・根拠・出典（プロベナンス）・関係性などの構造化された検証可能情報を付与し、LLMエージェントが直接扱いやすくする「Knows」という軽量フォーマットを提案しています。
Knowsは、元のPDFの横に薄いYAMLのサイドカー（KnowsRecord）を添える方式で、出版物側の変更を不要にしつつ、決定論的なスキーマリンタで正しさを検証します。
14の学術分野にまたがる20本の論文・140の理解度質問を用いた評価では、サイドカーを使うことで、小規模（0.8B〜2Bパラメータ）の「弱い」LLMエージェントの精度が大きく向上し、入力トークン数も削減されたことが示されています。
LLM-as-a-judgeによる再スコアリングでは、サイドカー併用時の弱いモデルの精度が、強いモデルのPDFのみ読み取りにかなり近づくことが示唆されます。
コミュニティのサイドカー・ハブが1万件超の出版物をインデックスしているという初期の採用シグナルを報告しており、スケールと実運用準備性を裏付ける材料になっています。

Abstract

研究成果のアーティファクトは、主にPDFのような読者向けドキュメントとして配布されます。これにより、ますますエージェント支援型およびエージェントネイティブな研究ワークフローにおいてボトルネックが生じます。この種のワークフローでは、LLMエージェントが長大な全文ドキュメントから、きめ細かなタスクに関連する情報を推論する必要がありますが、この処理はコストが高く、反復的で、大規模環境では不安定です。私たちはKnowsを提案します。これは軽量なコンパニオン仕様であり、既存の研究アーティファクトに対して、構造化された主張（claims）、根拠（evidence）、出所（provenance）、検証可能な関係（verifiable relations）を、LLMエージェントがそのまま直接利用できる形で結び付けます。Knowsは、元のPDFと共存する薄いYAMLサイドカー（KnowsRecord）によってこのギャップを埋めます。出版物自体の変更は不要で、決定論的なスキーマリンタによって検証されます。私たちは、14の学術分野にまたがる20本の論文に対し、140の理解度質問でKnowsを評価し、PDFのみ、サイドカーのみ、およびハイブリッド条件を、能力の異なる6つのLLMエージェントで比較しました。弱いモデル（0.8B--2Bパラメータ）は、PDFを読む場合の19--25\%から、サイドカーを読む場合は47--67\%へと改善します（+29〜+42パーセンテージポイント）。また、入力トークン使用量は29--86\%少なくなります。さらに、LLMをジャッジとして用いた再スコアリングにより、弱いモデルのサイドカー精度（75--77\%）が、より強いモデルのPDF精度（78--83\%）に近づくことが確認されます。この統制された評価の範囲を超えて、https://knows.academy/ にあるコミュニティのサイドカーハブは、すでに10,000本以上の出版物をインデックスしており、日々成長を続けています。これは、このフォーマットが大規模な普及に向けて採用可能であることを示す独立した証拠です。

AIエージェントで人事制度が耐えられない話

note

ミツカル｜生成AIツール専門比較・ランキングメディア【毎週火・木・土の18:00に投稿！】

note

【本音検証】Claude Opus 4.7は本当にすごい？5項目の評価を本音レビュー

note

【個人開発ストーリー】サボったらAIが煽ってくる筋トレアプリ「FitLoop」を6日で作ってApp Storeに出した全記録

note

「世界平和」を同じプロンプトで問うたら、AIの個性が爆発した夜。Gemini vs ChatGPT今夜開幕したw｜夜のAI対話録#9

note

Knows：エージェントネイティブな構造化リサーチ表現

要点

Abstract

関連記事

AIエージェントで人事制度が耐えられない話

ミツカル｜生成AIツール専門比較・ランキングメディア【毎週火・木・土の18:00に投稿！】

【本音検証】Claude Opus 4.7は本当にすごい？5項目の評価を本音レビュー

【個人開発ストーリー】サボったらAIが煽ってくる筋トレアプリ「FitLoop」を6日で作ってApp Storeに出した全記録

「世界平和」を同じプロンプトで問うたら、AIの個性が爆発した夜。Gemini vs ChatGPT今夜開幕したw｜夜のAI対話録#9

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

AIエージェントで人事制度が耐えられない話

ミツカル｜生成AIツール専門比較・ランキングメディア【毎週 火・木・土の18:00に投稿！】

【本音検証】Claude Opus 4.7は本当にすごい？5項目の評価を本音レビュー

【個人開発ストーリー】サボったらAIが煽ってくる筋トレアプリ「FitLoop」を6日で作ってApp Storeに出した全記録

「世界平和」を同じプロンプトで問うたら、AIの個性が爆発した夜。Gemini vs ChatGPT今夜開幕したw｜夜のAI対話録#9

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ミツカル｜生成AIツール専門比較・ランキングメディア【毎週火・木・土の18:00に投稿！】