大規模言語モデルによるイン・コンテキスト・プロンプトを用いた、スイスの公共部門向けサステナブル調達基準の生成と評価

arXiv cs.CL / 2026/3/25

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文は、スイスおよびEUのサステナビリティ規制を、入札で用いられる具体的で検証可能な公共調達基準へと変換する、労力を要する課題に取り組む。
  • 柔軟に設定可能な、LLM支援パイプラインを提案し、イン・コンテキスト・プロンプトと交換可能なLLMバックエンドを用いて、サステナビリティ志向の選定・落札(award)・技術基準のカタログを生成および評価する。
  • 自動化された出力検証と、LLMベースの評価コンポーネントを用いることで、純粋に手作業で起草する場合と比べて、監査可能性を高め、誤りを減らす。
  • proof-of-conceptでは、構造化された公式ガイドラインを取り込み、評価は自動化された品質チェックと、手作業で編集された「ゴールドスタンダード」との専門家による比較を組み合わせて行う。
  • 結果は、公式ガイドラインとの一貫性を維持しつつ、手作業の起草にかかる労力を大幅に削減できることを示すとともに、実運用における限界や失敗モードを文書化した。

Abstract

公共調達とは、政府、自治体、または公的資金によって運営される機関などの公共部門の組織が、物品およびサービスを取得するためのプロセスを指します。スイスの法律では、環境的、社会的、経済的な持続可能性に関する要件を、応札者が満たさなければならない基準の形式で、入札評価に統合することが求められています。しかし、高レベルの持続可能性に関する規制を、具体的で検証可能かつ分野(セクター)固有の調達基準(選定基準、落札(加点)基準、技術仕様など)へと翻訳する作業は、依然として労力を要し、誤りが起こりやすい手作業であり、複数の品目およびサービス群に関する相当なドメイン専門知識と、相応の手作業の工数を必要とします。本論文では、スイス向けの持続可能性志向の調達基準カタログを体系的に生成し評価するためのソフトウェアとして提示される、構成可能なLLM支援パイプラインを提案します。このシステムは、インコンテキスト・プロンピング、交換可能なLLMバックエンド、自動化された出力検証を統合し、異なる調達セクターにまたがって監査可能な基準生成を可能にします。概念実証として、スイス政府および欧州委員会によって公表された公式の持続可能性ガイドラインを、構造化された参照文書として取り込み、パイプラインを具体化します。本システムは、LLMベースの評価コンポーネントを含む自動化された品質チェックと、専門家による手作業でキュレーションされたゴールドスタンダードとの比較を組み合わせて評価します。その結果、提案するパイプラインは、公式ガイドラインと整合した基準カタログを生成しつつ、手作業による起案(ドラフティング)の工数を大幅に削減できることを示しました。さらに、導入(デプロイ)の過程で観測されたシステムの制約、失敗モード、および設計上のトレードオフについて論じ、公的部門のソフトウェア業務フローに生成AIを統合する際の重要な考慮点を明らかにします。