広告

エージェント型RAGシステムに関するフィードバックを探しています

Reddit r/LocalLLaMA / 2026/3/29

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • 著者は「エージェント型RAG(agentic RAG)」システムについて、単なるアップロードして質問するデモではなく“出荷可能(shippable)”なものを目指した設計に対するフィードバックを求めています。
  • このシステムには認証済みユーザーが含まれ、ドキュメントの所有権とドキュメントにスコープしたリトリーバを備えることで、ドキュメント間のデータ漏えいを減らします。
  • リトリーバをツールとして公開し、ツール呼び出しを伴うエージェントループに加えて、クエリの洗練(query refinement)、セマンティックキャッシュ、プラガブルな埋め込み(embeddings)とオプションの再ランキング(reranking)を使用します。
  • スタックは FastAPI、SQLAlchemy、Postgres(pgvector)、Chroma を組み合わせ、OpenAI/HuggingFace の埋め込みと、オプションで Cohere のリランカーを用い、Docker でパッケージ化されています。
  • さらに、実行履歴(run history)とケースの検査(case inspection)を備えた評価パイプライン、質問を行って評価を実行できるビルトインUIも備えており、レビュー用にリポジトリが提供されています。

みなさん、こんにちは。

私はRAGシステムに取り組んでいて、同様のシステムを構築したりスケールさせたりしたことのある方々から、ぜひフィードバックをいただけると嬉しいです。

これは単なる基本的な「アップロード+質問」デモではありません。実際に出荷するようなものをイメージして設計してみました。

それは何をするのか

  • ドキュメントの所有権を持つ認証済みユーザー
  • ドキュメントスコープの検索(ドキュメント間の情報漏えいを防ぐため)
  • ツール呼び出しを伴うエージェントループ(retrieverをツールとして使用)
  • クエリの洗練+セマンティックキャッシュ
  • プラグイン可能な埋め込み+任意の再ランキング
  • 実行履歴とケースの検査を含む評価パイプライン
  • 質問の実行と評価のための内蔵UI

技術スタック

  • FastAPI + SQLAlchemy + Postgres(pgvector)
  • ベクトルストレージにChroma
  • OpenAI / HuggingFaceの埋め込み
  • 任意のCohereリランカー
  • Docker化されたセットアップ

githubリポジトリ: https://github.com/mahmoudsamy7729/agentic-rag

投稿者: /u/Icy_Ant4265
[link] [comments]

広告