AI Navigate

壊れたRAGパイプラインを診断するCLI(フィードバック募集)

Reddit r/LocalLLaMA / 2026/3/13

📰 ニュースDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • 著者は、コードベースを分析してRAGパイプラインの構造的問題を検出するCLIを構築しており(LangChain、LlamaIndex、カスタムパイプラインなど)、フィードバックを求めている。
  • このツールは決定論的になるよう設計されており、AIは平易な言葉で所見を説明するためだけに使用されるので、CIで実行して再現可能な結果を得られる。
  • 「RAGアーキテクチャのESLint」のようなものを目指しており、コードを解析し、ルールエンジンを適用し、不正なチャンク化、埋め込みモデルの不一致、取得の欠如、コンテキスト窓のオーバーフロー、ベクトル検索の設定ミス、プロンプトインジェクションのリスクなどを報告する。
  • 著者は、珍しいパイプラインを試してもらうようコミュニティに呼びかけ、フィードバック用のGitHubリポジトリのリンクを提供している:https://github.com/NeuroForgeLabs/rag-doctor

皆さん、こんにちは、

ここ数か月、さまざまなRAGの設定(LangChain、LlamaIndex、カスタムパイプラインなど)を構築・テストしてきましたが、同じ苛立つ問題に何度も直面していました。

RAGシステムが悪い答えを出し始めると、すぐにLLMのせいだと誰もが非難します。

しかし、実際の問題はほとんどの場合、パイプラインのどこかにあります。

次のようなことです:

• ドキュメントは正しくチャンク化されていない • 埋め込みは検索モデルと一致していない • あなたが思っているときに検索が実際には行われていない • コンテキスト窓がオーバーフローしている • ベクトル検索の設定が誤っている • プロンプトインジェクションのリスク 

このようなことを何度もデバッグした後、コードベースを分析してRAGパイプラインの構造的問題を検出しようとする小さなCLIツールを作るようになりました。

アイデアは基本的には:

「RAGアーキテクチャの ESLint のようなもの。」

ツールはコードベースを解析し、ルールエンジンを実行し、潜在的な問題を報告します。

私が下した重要な設計上の選択肢の一つ:

分析自体は決定論的です。AIは平易な言葉で所見を説明するためだけに使用されます。

そのため、CIでの実行が可能で再現性のある結果を生み出します。

まだ初期段階ですが、気になる点があります:

実際のプロジェクトで最も頻繁に見られるRAGの問題は何ですか?

また、変わったパイプラインで壊してみたい人がいれば、それは実際に非常に役立つでしょう。

リポジトリ:

https://github.com/NeuroForgeLabs/rag-doctor

RAGシステムを構築している人からのフィードバックをぜひお願いします。

投稿者: /u/anvarxadja99
[リンク] [コメント]