BrainDB:カーパシーの『LLMウィキ』構想を、型付きエンティティとグラフを備えた実DBとして実現

Reddit r/LocalLLaMA / 2026/4/20

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • BrainDBは、カーパシーの「LLMウィキ」構想(LLMが読み書きできる永続的な外部メモリ)に触発されつつ、それを検索とグラフ機能を備えた構造化データベースとして実装したものです。
  • RAGのようにクエリごとに状態を持たず、BrainDBは思考・事実・出典・ルールなどの型付きエンティティを永続的に保存し、supports/contradicts/derived_from等の明示的な関係で結びます。
  • 取得結果はテキスト断片の集合ではなく、ランク付けされた「グラフ近傍」を返し、さらに時間減衰により古い情報は薄れつつ、よく参照される情報が維持される設計です。
  • Neo4jなどの一般的なグラフDBと比べて、BrainDBはLLMエージェント向けにHTTP API(ツール呼び出し用)や、certainty/importanceのような意味論的フィールド、自動プロバナンス、ルールの組み込みなどを備えています。
  • Markdownのようなフラットな記憶の代替として、文書から抽出した事実を出典へ自動リンクし、エージェントが明示的に要求したときだけ全文を読み込む方針を取ります。
BrainDB: Karpathy's 'LLM wiki' idea, but as a real DB with typed entities and a graph

なぜBrainDBなのか?

Karpathyの「LLM wiki」アイデアに触発されました。つまり、LLMに、読み書きできる永続的な外部メモリを与えるというものです。BrainDBはその上に「プレーンなmarkdownファイル」という土台から、構造化、検索、そしてグラフを追加することでさらに発展させています。

  • RAGとの違い。 RAGはステートレスです。文書を埋め込み、各クエリごとに似たチャンクを検索して、それらをコンテキストに詰め込みます。持続し、接続が蓄積され、経年劣化する「エンティティ」という概念はありません。BrainDBは、型付きエンティティ(思考、事実、ソース、ドキュメント、ルール)を、明示的なsupports / contradicts / elaborates / derived_from / similar_toの関係とともに保存します。さらに、ファジー+セマンティック検索を組み合わせ、最大3ホップまでのグラフ探索、そして時間的減衰(古くなったアイテムは薄れていく一方、参照されたものは鮮明さを保つ)を備えています。検索はチャンクの山を返すのではなく、ランク付けされたグラフ近傍を返します。
  • 従来のグラフDBとの違い(Neo4j、Memgraph)。これらは汎用のグラフストアで、それぞれ独自のクエリ言語や演算コストがあります。BrainDBはLLMエージェント向けに特化しており、ツール呼び出しのためのプレーンなHTTP APIを用意しています。さらに意味のあるフィールド(certaintyimportanceemotional_valence)を備え、幾何平均によるスコアリングのための組み込みテキスト+pgvector検索、常時有効なルール注入、自動のプロベナンス(出所証明)を提供します。そして、実行基盤はプレーンなPostgreSQL + pg_trgm + pgvectorのみで、新たなインフラを運用する必要がありません。
  • メモリとしてのmarkdownファイルとの違い。 Markdownウィキはフラットで非構造です。LLMはgrepして、ファイル全体をコンテキストに読み込み、リンクを手作業で管理しなければなりません。BrainDBのエンティティは原子的で、クエリ可能で、ランク付けされ、自律的に接続されます。ドキュメントから抽出された事実は、derived_fromによってソースへ自動的にリンクされます。想起(リコール)は、関連するノードに加えてそれらのグラフ近傍を返します。エージェントが要求しない限り、何も全文を読み込む必要はありません。
提出者 /u/dimknaf
[リンク] [コメント]