https://reddit.com/link/1rv38qs/video/z3f8s0g50dpg1/player
以前投稿したデモの簡単な更新です。
以前はシステムは約12,000件の文書を処理していました。
現在はローカルで約32,000件の文書に対応します。
ハードウェア:
- ASUS TUF Gaming F16
- RTX 5060 ノートPC用GPU
- 32GBのRAM
- 小売価格約$1,299
このデモのデータセット:
- ACL風のフォルダ階層配下に約30,000件のPDFファイル
- 研究用PDF約1,000件(RAGBench)
- 約1,000件の多言語ドキュメント
すべてが端末上で動作します。
前回の投稿と比較して、RAG検索トークンは 約2000 → 約1200 トークンへ削減されました。コストを低くし、AI PC / エッジデバイスにより適しています。
インデックス作成中にもフォルダ構造を保持するため、エンタープライズ風の知識整理とアクセス制御を維持できます。
小型のローカルモデル(Qwen 3.5 4Bでテスト) は比較的よく機能しますが、より大きなモデルは一部のケースでより整った出力をまだ生成します。
動画の最後には、追加文書の段階的インデックス付けも表示されます。
[リンク] [コメント]