DeepSeekとWeaviateでRAGパイプラインを作った方法
Dev.to / 2026/6/16
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- 著者は、スケール時に高額になりがちな既存のRAGチュートリアルを踏まえ、費用を抑えるためにRAGパイプラインを作り直した経緯を説明しています。
- 彼らは支出を減らす最大のレバーはモデル選定だと主張し、利用可能なモデルのAPI価格がトークンあたりで大きく幅広い点を示しています。
- この記事では、著者が繰り返し使う5つのモデルを紹介しており、特に大半の問い合わせにはDeepSeek V4 Flash、長い文脈が必要な場合にはDeepSeek V4 Proを挙げています。
- Qwen3-32BやGLM-4 Plusといった他の選択肢も、用途に応じて使い分けており、GPT-4oとの比較でコスト差を示しています。
この記事の続きは原文サイトでお読みいただけます。
原文を読む →