広告

CitiLink:検索可能な議事録によって自治体の透明性と市民の関与を高める

arXiv cs.CL / 2026/3/30

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • CitiLinkは、非構造化の市議会議事録を構造化された検索可能なデータに変換するデモ・プラットフォームであり、自治体の透明性と市民/ジャーナリストのアクセスを改善します。
  • このシステムでは、LLM(大規模言語モデル)ベースの情報抽出を用いて、議論された主題、抽出されたエンティティ、投票結果といったメタデータを生成し、全文検索(BM25)およびファセット(絞り込み)による検索を可能にするためにインデックス化します。
  • CitiLinkは、合成データではなく実際の自治体文書に対して実現可能性を示すことを目的として、6つのポルトガル自治体から提供された120分分の資料を用いて構築されました。
  • ユーザビリティは、自治体職員を対象にしたガイド付きセッションにより評価し、検索およびフィルタリングのインターフェースでユーザがどのように操作するかを観察しました。
  • 本研究では、Geminiの抽出品質も評価し、議事録から関連情報を抽出するうえでの有効性を報告しています。

Abstract

市議会の議事録は通常、長く、形式張った文書であり、官僚的な文体で書かれています。公開はされているものの、その構造のために、市民やジャーナリストが情報を効率的に見つけることが難しいことがよくあります。このデモでは、非構造化の自治体の会議議事録を、構造化された検索可能なデータへと変換することを目的としたプラットフォームであるCitiLinkを提示し、NLPとIRが地方行政のアクセシビリティと透明性をどのように高められるかを示します。システムはLLMを用いてメタデータ、議論された主題、採決結果を抽出し、その後、データベースにインデックスすることで、BM25によるランキング付きの全文検索と、ユーザーフレンドリーなインターフェースによるファセット(絞り込み)を可能にします。開発したシステムは、6つのポルトガルの自治体が公開した120本の議事録のコレクションをもとに構築されました。利用性を評価するために、CitiLinkは自治体職員とのガイド付きセッションを通じてテストされ、実際の利用者がどのようにシステムとやり取りするのかについての洞察が得られました。さらに、議事録から関連情報を抽出する上でのGeminiの性能も評価し、データ抽出におけるその有効性を示しました。

広告