チャータード・アカウンタント業務のための検索拡張推論(Retrieval-Augmented Reasoning)
arXiv cs.AI / 2026/5/4
💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本稿は、LLMが金融分野での導入を進める一方で、インドのチャータード・アカウンタンシーのような管轄ごとの複雑な業務では、多段の数値推論や法規制知識の不足により信頼性が十分でないと指摘しています。
- CA-ThinkFlowとして、14Bの4ビット量子化推論モデル(14B-DeepSeek-R1)と、文書の構造を保持するレイアウト対応Docling抽出システムを組み合わせた、パラメータ効率の高いRAGフレームワークを提案しています。
- CA-ThinkFlowはシンプルなRAGで取得した情報をプロンプトに自動投入し、モデル内蔵のChain-of-Thought(CoT)で文脈を作って回答を生成します。
- マルチレベルのCA-Benベンチマークで評価した結果、Scholarastic Reliability Coefficient(SRC)において大規模なプロプライエタリモデルと同等レベルに到達し、GPT-4oおよびClaude 3.5 Sonnetの68.75%に相当する性能を示したと報告されています。
- 効率性やパラメータ面での強みはあるものの、税務などに見られる複雑な規制文書の処理では、推論能力が十分に機能せず課題が残ると述べています。
- 本研究はarXivのpreprint(v1)として公表されており、実運用済みの製品というより研究段階であることが示されています。
