DeepSeekとWeaviateでRAGパイプラインを作った方法

Dev.to / 2026/6/16

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 著者は、スケール時に高額になりがちな既存のRAGチュートリアルを踏まえ、費用を抑えるためにRAGパイプラインを作り直した経緯を説明しています。
  • 彼らは支出を減らす最大のレバーはモデル選定だと主張し、利用可能なモデルのAPI価格がトークンあたりで大きく幅広い点を示しています。
  • この記事では、著者が繰り返し使う5つのモデルを紹介しており、特に大半の問い合わせにはDeepSeek V4 Flash、長い文脈が必要な場合にはDeepSeek V4 Proを挙げています。
  • Qwen3-32BやGLM-4 Plusといった他の選択肢も、用途に応じて使い分けており、GPT-4oとの比較でコスト差を示しています。

この記事の続きは原文サイトでお読みいただけます。

原文を読む →