Claude Code × LLM不使用の長期記憶sui-memory — 高速化&精度UPカスタマイズ記
Zenn / 2026/3/31
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage
要点
- Claude Codeと「LLM不使用の長期記憶」sui-memoryを組み合わせ、長期記憶の遅延と精度を両立させるためのカスタマイズ方針を示している。
- 連想・検索・更新といった記憶処理の設計を見直し、応答のボトルネック(レイテンシ)を下げる工夫が中心になっている。
- LLMを使わない前提で、保存・参照の運用を最適化することで精度(参照の的確さ)を上げるアプローチを述べている。
- 全体として、長期記憶機構を「実運用で速く・当たりやすく」するための実装/チューニング観点がまとめられている。
hookに記憶検索を仕込んだら、プロンプトを送るたびに7秒待たされるようになった——そんな状況に心当たりはないだろうか。結論から言うと、ベクトル検索の発火を制御してFTS5メインに切り替えたら0.09秒まで落ちた。
前回の記事(TODO: リンク)で、Claude Codeのhookを使ったセッション間記憶(sui-memory)を作った。SQLiteに会話ログを保存し、次のセッションでUserPromptSubmitフックから関連記憶を検索・注入する仕組みだ。作った直後は快適に動いていた。
1週間後に気づいた「毎回7秒」の正体
導入から1週間後、蓄積データが溜まったタイミングで動作...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



