大規模言語モデルによるイン・コンテキスト・プロンプトを用いた、スイスの公共部門向けサステナブル調達基準の生成と評価
arXiv cs.CL / 2026/3/25
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、スイスおよびEUのサステナビリティ規制を、入札で用いられる具体的で検証可能な公共調達基準へと変換する、労力を要する課題に取り組む。
- 柔軟に設定可能な、LLM支援パイプラインを提案し、イン・コンテキスト・プロンプトと交換可能なLLMバックエンドを用いて、サステナビリティ志向の選定・落札(award)・技術基準のカタログを生成および評価する。
- 自動化された出力検証と、LLMベースの評価コンポーネントを用いることで、純粋に手作業で起草する場合と比べて、監査可能性を高め、誤りを減らす。
- proof-of-conceptでは、構造化された公式ガイドラインを取り込み、評価は自動化された品質チェックと、手作業で編集された「ゴールドスタンダード」との専門家による比較を組み合わせて行う。
- 結果は、公式ガイドラインとの一貫性を維持しつつ、手作業の起草にかかる労力を大幅に削減できることを示すとともに、実運用における限界や失敗モードを文書化した。