みなさんこんにちは、
最近、約300万本のarXiv論文を含むModel Context Protocol(MCP)インデックスを構築し終えました。私の目的は、ローカルおよびクラウドのLLMを、MLやSTEMの巨大なコーパスに直接つなげやすくすることで、幻覚的な引用を減らし、研究ワークフローを改善することです。
インデックスはすでに公開中ですが、広く開放する前に、非常にニッチで複雑なクエリ(特に、あまり知られていない数学、極端に特化した領域、あるいは新しいアーキテクチャ)に対して、検索品質が実際にどれだけ耐えられるかを確認したいと思っています。
そこで、少人数の方々(約20人)に試していただき、検索システムを壊そうとする/あえて攻めていただき、取得された論文の関連性について容赦ないフィードバックをください。
ご自身のLLMセットアップでストレステストしてみて、日々の研究クエリでどのような性能かを確かめたい場合は、コメントかDMで知らせてください。接続の詳細をお送りします!
ありがとうございます!
[リンク] [コメント]




