2026年5月時点におけるローカル調査(リサーチ)ツールの現状

Reddit r/LocalLLaMA / 2026/5/5

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • 著者は(2026年5月時点で)ローカル・ディープリサーチ系ツールの現状を調べ、プロジェクトの健全性やコミュニティの活動状況を比較してまとめています。
  • 「GPT Researcher」(assafelovic)と「Local Deep Research」(LearningCircuit)の2つを、最も健全でローカル向きだと紹介しています。なお「Local Deep Research」ではSearXNGの利用が挙げられています。
  • 「Local Deep Research」は最近のコミットや多数のPRのクローズ/マージなどから一定の活動性はある一方で、長期間停滞している課題(issues)やPRも見られると述べています。
  • 「STORM」(Stanford)はほぼ放置されているとされており、古いコミット、返信のない不具合報告、直近のPRのキャンセルなどが指摘されています。
  • 「GPT Researcher」については、メンテナンス面(古いブランチ、レビューの遅れ)が懸念される一方で、MCPを中心にしたインターネット検索やWebスクレイピングを別のMCPプロジェクト経由で行う点が強調されています。

考えていたのですが、このコミュニティの中には、ローカルのディープリサーチ分野で現在どんな選択肢があるのかを見てみたい人もいるはずです。そこで、見つけられる限りの情報を集めるのに少し時間を使いました。どうぞ。

TLDR: 最も健康的で、かつローカル環境に馴染みやすいプロジェクトは、assafelovic による「GPT Researcher」および LearningCircuit による「Local Deep Research」です。

LearningCircuit による「Local Deep Research」

観察:

  • python
  • セミアクティブ - 最終コミットは昨日
  • 貢献者数は中程度 - 46
  • 75件のオープンイシュー(投稿者側が半分、ユーザー側が半分だが、長い月のあいだコメントなし)/ 254件クローズ(多くは自己申告)
  • 161件のオープンPR(投稿者によるものが多く、何週間も宙ぶらりんのものがある――何のために??)/ 3309件クローズPR(見た目には投稿者またはdependobot由来が95%)
  • SearXNGを使用

Reddit - https://www.reddit.com/r/LocalLLaMA/s/F4o4jCL4IA
サブレディット - https://www.reddit.com/r/LocalDeepResearch/
Github - https://github.com/LearningCircuit/local-deep-research
ベンチマーク - https://huggingface.co/datasets/local-deep-research/ldr-benchmarks

Stanford による「STORM」

観察:

  • python
  • 放置状態 - 最終コミットは8か月前
  • 貢献者数は少なめ - 23
  • 58件のオープンイシュー(返信なしのバグ報告が多い)/ 164件クローズ(主に、解決に至らず計画されていなかったため)
  • 60件のPR(ほとんど返信なし)/ 111件クローズ(直近2年はただキャンセルされているだけ)
  • さまざまな取得(retrieval)サービスを使用 - YouRM、BingSearch、VectorRM、SerperRM、BraveRM、SearXNG、DuckDuckGoSearchRM、TavilySearchRM、GoogleSearch、AzureAISearch

Github - https://github.com/stanford-oval/storm
公式サイト - https://storm-project.stanford.edu/

assafelovic による「GPT Researcher」

観察:

  • python + typescript
  • セミアクティブ - 最終コミットは3週間前
  • 保守があまり良くない - 古いブランチが大量にある
  • 貢献者数が多い - 211
  • 173件のオープンイシュー(2026年のイシューにほとんど反応がない)/ 511件クローズ(主に修正あり)
  • 44件のオープンPR(レビューやコメントなしで6か月前から止まっているものがある)/ 785件クローズ(統合されているのは60〜70%)
  • MCPに執着している - インターネット検索 & Webスクレイピングは別のMCPで実行 https://github.com/assafelovic/gptr-mcp が、そこではサードパーティAPIを使用

Github - https://github.com/assafelovic/gpt-researcher
ドキュメント - https://docs.gptr.dev/
公式サイト - https://gptr.dev/

LangChain による「Local Deep Research」

観察:

  • python
  • セミアクティブ - 最終コミットは2週間前
  • 貢献者数は少なめ - 14
  • 36件のオープンイシュー(返信なしが多い)/ 39件クローズ(解決策あり)
  • 6件のオープンPR(一年以上止まっているものがある)/ 48件クローズ(主にdependabotによるもので、ユーザーからの最近の貢献はなし)
  • DuckDuckGo、SearXNG + 商用プロバイダー

Github - https://github.com/langchain-ai/local-deep-researcher

LangChain による「Open Deep Research」

LangChainの連中は何を吸ってるんでしょうか? 名前が似た2つのプロジェクトがあって、片方はほぼもう片方の後継だと思われますが、それについてREADMEで一言も触れられていません。

観察:

  • python + Jupyter notebook(???)
  • 放置状態 - 人間による最終開発作業は2025年8月で終了
  • 貢献者数は少なめ - 26
  • 34件のオープンイシュー(2025年11月以降返信なし)/ 95件クローズ
  • 24件のオープンPR(コメントなし/レビューなし)/ 114件クローズ(コミュニティの貢献はほとんど捨てられている)
  • インターネット検索エンジンとして何を使っているかの情報がない

GitHub - https://github.com/langchain-ai/open_deep_research

Together による「Open Deep Research」

観察:

  • python
  • 放置状態 - 最終コミットは1年前、コミットは合計3件のみ
  • 投稿者は1人
  • オープン/クローズのイシューなし
  • PRなし
  • Web検索にはTAVILYに依存

Github - https://github.com/togethercomputer/open_deep_research
ブログ記事 - https://www.together.ai/blog/open-deep-research

ByteDance による「Deer flow」(Deep Exploration and Efficient Research Flow)

OpenAI互換プロバイダーなら何でも対応

観察:

  • python
  • アクティブ - 最終コミットは19分前
  • 貢献者数が多い - 253
  • 444件のオープンイシュー(主に中国の人たちによるもので、多くは返信あり)/ 735件クローズ(半分がコード変更あり)
  • 257件のオープンPR(レビューとマージ待ちのものが多い)/ 1230件クローズ(見た目には70%がマージ済み)
  • インターネット検索には「Info Quest」を使用(プロプライエタリ、課金)

Github - https://github.com/bytedance/deer-flow
公式サイト - https://deerflow.tech/

Alibaba による「Deep Research」

観察:

  • python
  • 放置状態 - 最終コミットは数か月前
  • 貢献者数は少なめ - 27
  • 単一モデルの利用に注力 - 自分たちの「Tongyi-DeepResearch-30B-A3B」
  • ベンダーロックイン - 検索にはSerper.dev、スクレイピングにはJina.aiに密着している

Github - https://github.com/Alibaba-NLP/DeepResearch

MiroMindAI による「MiroThinker」

観察:

  • セミアクティブ - 最終コミットは3週間前
  • 貢献者数は少なめ - 19
  • 自分たちのモデルの使用に注力 - 「MiroThinker-1.7-mini」(30B)または「MiroThinker-1.7」(235B)
  • ベンダーロックイン - 自分でSERPER_API_KEY、JINA_API_KEYを用意
  • デモページからテスト用のリサーチを動かそうとしたが、見事にコケた

Github - https://github.com/MiroMindAI/MiroThinker
公式サイト - https://www.miromind.ai/

Zilliztech による「Deep-searcher」

観察:

  • 放置状態 - 最終コミットは6か月前
  • 貢献者数は少なめ - 31
  • 40件のイシュー、50件クローズ
  • 6件の保留中PR、167件クローズ(ほとんどがマージ済み)

Github - https://github.com/zilliztech/deep-searcher

PS

上の表を作るために、LLM支援のリサーチツールは使用していません。単に私と自分の手だけです。上記プロジェクトのうち、デモ用のWebサイトがあるのは少数で、Mirothinker、Storm、DeerFlowでしたが、

  • Mirothinker は1時間でかなり包括的なレポートを生成しましたが、githubの指標の半分をでたらめに捏造(hallucination)しており、残り半分を集めることには一切関心がありませんでした。信頼できず、使い物になりません。
  • Stormは、何をリサーチし、どんな種類の結果が必要かについて長めの指示を与えられないため、ディープリサーチ用途では基本的に使い物になりません。リサーチペーパーのタイトルをどうするべきか、という酷く短い文字列があるだけです。
  • DeerFlowサイトは完全に壊れていて、認証を通過できず、さまざまな404も出ます。ByteDanceのWeb開発者の皆さん、残念です!
  • 時間があって、あなたの手元のディープリサーチ用エージェントが近くにいるなら、下のプロンプトを試してみてください。結果がどうなるのか、私は本気で気になっています。特に、githubの図でどれくらいのハルシネーションがあるのか。

    最適な手元(ローカル)のディープリサーチプロジェクトを見つけて比較してください。結果を表にまとめてください。表には次を含める必要があります: - ベンダー/会社名 - プロジェクト名 - githubのURL - 発表されたプロダクトの公式サイトまたはブログURL - githubへの最後のコミットが行われた時期 - githubのissue数とPR数 - githubプロジェクトへの貢献者数 - プロジェクトのドキュメントが、専用のLLMモデルの使用を推奨しているかどうか - プロジェクトに独自のWeb検索およびWebページスクレイピングツールが付属しているかどうか 
    投稿者 /u/Shoddy-Tutor9563
    [リンク] [コメント]