知識ベースを自然淘汰するRAGをつくってみた

Zenn / 3/29/2026

💬 OpinionDeveloper Stack & InfrastructureTools & Practical Usage

Key Points

  • RAGの構築において、知識ベースが肥大化・陳腐化していく問題に対処するため「自然淘汰」を取り入れた設計を試作した内容です。
  • 参照すべき情報を検索結果から最適化し、不要/重複/低品質になり得る知識を自動的に減らすことで、回答品質や運用効率の改善を狙っています。
  • LLMへの入力に渡る根拠(文書)を継続的に見直す考え方で、データ更新・精度劣化への耐性を高めるアプローチになっています。
  • 実装面では、RAGのパイプライン(取り込み→検索→生成)に淘汰ロジックを組み込み、実験しながら挙動を確認したプロセスが中心です。
RAG の知識ベース(ルール集)を Thompson Sampling + LLM の突然変異・交差・淘汰 で自動進化させる仕組みを作った 1,900回以上の実験で、進化なしと比べて +11〜18ポイント の正答率向上を確認 仕様変更でルールが全部ゴミになっても 勝手に回復 する(V字回復) 必要なもの: Python + JSON + Gemini API キー ! 高1(もうすぐ高2)が個人で作りました。コードは全部 AI に書かせています。PC 歴 3ヶ月。API代が財布に響くので「もっと回せ」はご容赦ください。 GitHub URL: https://github.com/...

Continue reading this article on the original site.

Read original →