連邦議会のソーシャルメディアにおける問題と解決策の枠組みの分類

arXiv cs.CL / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、「ガベージ・キャン」モデルが、政策プロセスを「問題」重視と「解決策」重視に区別することでどのように表現されるかを検討し、その観点から米国上院議員のTwitter投稿がそれを反映している様子を分析する。
  • 著者らは1,680,000件のツイートからなる大規模データセットを用い、政策の専門家が3,967件のツイートを「問題」「解決策」またはその他に手動で注釈付けした上で、自動ラベリング手法を構築する。
  • ラベル付けデータを訓練/検証/テストの各サブセットに分割し、モデルのハイパーパラメータを反復的に調整しながら、F1スコアに重点を置いた教師あり分類器を学習・評価する。
  • 最も良い性能を示した手法では、BERTweet Baseモデルを微調整し、交差検証においてカテゴリ全体で平均加重F1スコアが0.8を超えることを達成する。

Abstract

「Garbage Can(ゴミ箱)モデル」に基づく、米国における政策設定は、「問題」志向のプロセスと「解決」志向のプロセスを区別している。本論文では、米国上院議員のTwitter投稿に関する大規模データセット(総計168万件のツイート)を調査する。我々の目的は、上院議員の投稿を「問題」ストリームまたは「解決」ストリームのいずれかに自動的にラベル付けする手法を開発する。2名の学術的な政策専門家が、3967ツイートの一部を「問題」「解決」、または「その他」(問題でも解決でもないもの)としてラベル付けした。我々はテストセットとして500ツイートの一部を切り分け、残りの3467を学習に用いた。開発の間、学習セットはさらに60/20/20の割合で、フィッティング用、検証用、開発テスト用の各セットに分割した。学習セット上で問題/解決の分類器を直接構築するための教師あり学習手法を調査し、検証セットにおけるF1スコアの観点でそれらの性能を評価した。これにより、モデルやハイパーパラメータを迅速に反復して検討でき、BERTweet Baseモデルを用いた3カテゴリに対するクロスバリデーションで、平均加重F1スコアが0.8を超えることを達成した。