こんにちは、
オンラインの議論が紛争へとエスカレートする様子をモデル化するフレームワークに取り組んでおり、それを分類/シーケンスモデリング問題として捉えられるかを検討しています。
核心となるアイデアは、議論を観測可能な遷移を持つ状態機械として扱うことです。
状態(提案)
- 中立(情報交換)
- 意見の相違
- アイデンティティの活性化
- 個人化
- 個人攻撃
- ドッグパイル(複数ユーザーによる標的化、回復不能)
各コメントは局所状態としてラベル付けでき、スレッドには時間とともに進化するグローバル状態もあります。
シグナル / 特徴
検討中の特徴:
- 言語的特徴:
- 二人称代名詞の増加(「you」)
- 感情の変化
- 侮辱・毒性の指標
- 構造的特徴:
- 特定の1人のユーザーへ返信するユニークなユーザー数
- 返信の速度(急増)
- スレッドの深さ
- 文脈的特徴:
- トピック感度(キーワードによる代理指標)
- スレッド内の過去の状態遷移
追加の次元
私はもう一つの層にも取り組んでいます:
- 個人アイデンティティの活性化
- イデオロギー的アイデンティティの活性化
- グループアイデンティティの活性化
複数のアイデンティティ層の同時活性化が急速なエスカレーションと相関するという仮説です。
データセット計画
- 公開プラットフォーム(Reddit など)からスレッドを収集する
- 上記の状態分類法を用いてラベル付きデータセットを構築する
- 小規模な手作業で注釈を付けたデータセットから始める
- 分類器を訓練する(ベースライン:ヒューリスティック → 機械学習モデル)
質問
- この枠組みは、シーケンス分類 / 状態遷移問題として意味を成しますか?
- これをどのようにモデル化しますか:
- コメントごとの分類、または
- シーケンスモデリング(例:HMM / RNN / スレッド全体の Transformer)ですか?
- 以下についての提案はありますか:
- 状態間の曖昧さを減らすためのラベリング指針?
- この目的に近い既存データセット(毒性分類を超えるもの)はありますか?
- 「dogpile」をクラスとして扱いますか、それともグラフ構造の出現的特性として扱いますか?
[リンク] [コメント]