連邦議会のソーシャルメディアにおける問題と解決策の枠組みの分類

arXiv cs.CL / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、「ガベージ・キャン」モデルが、政策プロセスを「問題」重視と「解決策」重視に区別することでどのように表現されるかを検討し、その観点から米国上院議員のTwitter投稿がそれを反映している様子を分析する。
著者らは1,680,000件のツイートからなる大規模データセットを用い、政策の専門家が3,967件のツイートを「問題」「解決策」またはその他に手動で注釈付けした上で、自動ラベリング手法を構築する。
ラベル付けデータを訓練／検証／テストの各サブセットに分割し、モデルのハイパーパラメータを反復的に調整しながら、F1スコアに重点を置いた教師あり分類器を学習・評価する。
最も良い性能を示した手法では、BERTweet Baseモデルを微調整し、交差検証においてカテゴリ全体で平均加重F1スコアが0.8を超えることを達成する。

Abstract

「Garbage Can（ゴミ箱）モデル」に基づく、米国における政策設定は、「問題」志向のプロセスと「解決」志向のプロセスを区別している。本論文では、米国上院議員のTwitter投稿に関する大規模データセット（総計168万件のツイート）を調査する。我々の目的は、上院議員の投稿を「問題」ストリームまたは「解決」ストリームのいずれかに自動的にラベル付けする手法を開発する。2名の学術的な政策専門家が、3967ツイートの一部を「問題」「解決」、または「その他」（問題でも解決でもないもの）としてラベル付けした。我々はテストセットとして500ツイートの一部を切り分け、残りの3467を学習に用いた。開発の間、学習セットはさらに60/20/20の割合で、フィッティング用、検証用、開発テスト用の各セットに分割した。学習セット上で問題／解決の分類器を直接構築するための教師あり学習手法を調査し、検証セットにおけるF1スコアの観点でそれらの性能を評価した。これにより、モデルやハイパーパラメータを迅速に反復して検討でき、BERTweet Baseモデルを用いた3カテゴリに対するクロスバリデーションで、平均加重F1スコアが0.8を超えることを達成した。

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

日経XTECH

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

日経XTECH

なぜAnthropicの新モデルがサイバーセキュリティの専門家を動揺させているのか

Reddit r/artificial

AI 2027の論文は、いまもなお正当性を持っているのか？

Reddit r/artificial

なぜほとんどの生産性システムが失敗するのか（そして代わりに何をすべきか）

Dev.to

連邦議会のソーシャルメディアにおける問題と解決策の枠組みの分類

要点

Abstract

関連記事

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

なぜAnthropicの新モデルがサイバーセキュリティの専門家を動揺させているのか

AI 2027の論文は、いまもなお正当性を持っているのか？

なぜほとんどの生産性システムが失敗するのか（そして代わりに何をすべきか）

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer