知識ベースを自然淘汰するRAGをつくってみた

Zenn / 3/29/2026

💬 OpinionDeveloper Stack & InfrastructureTools & Practical Usage

共有:

Key Points

RAGの構築において、知識ベースが肥大化・陳腐化していく問題に対処するため「自然淘汰」を取り入れた設計を試作した内容です。
参照すべき情報を検索結果から最適化し、不要/重複/低品質になり得る知識を自動的に減らすことで、回答品質や運用効率の改善を狙っています。
LLMへの入力に渡る根拠（文書）を継続的に見直す考え方で、データ更新・精度劣化への耐性を高めるアプローチになっています。
実装面では、RAGのパイプライン（取り込み→検索→生成）に淘汰ロジックを組み込み、実験しながら挙動を確認したプロセスが中心です。

RAG の知識ベース（ルール集）を Thompson Sampling + LLM の突然変異・交差・淘汰で自動進化させる仕組みを作った 1,900回以上の実験で、進化なしと比べて +11〜18ポイントの正答率向上を確認仕様変更でルールが全部ゴミになっても勝手に回復する（V字回復）必要なもの: Python + JSON + Gemini API キー ! 高1（もうすぐ高2）が個人で作りました。コードは全部 AI に書かせています。PC 歴 3ヶ月。API代が財布に響くので「もっと回せ」はご容赦ください。 GitHub URL: https://github.com/...

Continue reading this article on the original site.

Read original →