医療記録のOCR済みPDFを約20本(合計で約500ページ)持っています(診療メモ、検査結果など)。OCRはそれなりに良いのですが、少しノイズがあります(自分のノートPCで ocrmypdf を使って実行しました)。過去のすべての病院と検査について、専門家に素早く全体像を掴んでもらうために、この一式を対象とした構造化された要約を生成したいです。
借りられるマシンは、Windows 11 上の Ryzen 5 5600X に RX 590(8GB)と16GB RAM です。プライバシーのため、すべてをローカルに保ちたいですし、処理が遅くても問題ありません。
この種の作業に、このハードウェアで最適なアプローチやモデルは何でしょうか? 立ち上げが簡単で、(別の人のコンピュータを使うので)後片付けも簡単なものだと嬉しいです。私はローカルLLMの経験があまりなく、技術にはそれなりに詳しいのですが、今はあまり深く調べ込む気分でもありません。なので、シンプルで気取らない(ノーフリルな)解決策を探しています。
TIA.
[link] [comments]