みなさん、こんにちは。
私はRAGシステムに取り組んでいて、同様のシステムを構築したりスケールさせたりしたことのある方々から、ぜひフィードバックをいただけると嬉しいです。
これは単なる基本的な「アップロード+質問」デモではありません。実際に出荷するようなものをイメージして設計してみました。
それは何をするのか
- ドキュメントの所有権を持つ認証済みユーザー
- ドキュメントスコープの検索(ドキュメント間の情報漏えいを防ぐため)
- ツール呼び出しを伴うエージェントループ(retrieverをツールとして使用)
- クエリの洗練+セマンティックキャッシュ
- プラグイン可能な埋め込み+任意の再ランキング
- 実行履歴とケースの検査を含む評価パイプライン
- 質問の実行と評価のための内蔵UI
技術スタック
- FastAPI + SQLAlchemy + Postgres(pgvector)
- ベクトルストレージにChroma
- OpenAI / HuggingFaceの埋め込み
- 任意のCohereリランカー
- Docker化されたセットアップ
githubリポジトリ: https://github.com/mahmoudsamy7729/agentic-rag
[link] [comments]




