Redditで叩かれました(意図的に、調査目的で)。その後、観察結果を「IDDS — Identity-Driven Discourse Systems(アイデンティティ駆動のディスコース・システム)」という枠組みに整理しました。
核心となる洞察:エスカレーションはランダムではありません。アイデンティティ層のアクティベーションによって駆動される、予測可能な状態遷移に従います。2.1における重要な新機能はD_flag修飾子です。これは「アイデンティティ・アクティベーションがエスカレーションを加速するのは、すでに見解の相違が存在するときだけ」というものです。つまり、フレンドリーなスレッド(D_flag=0)で自分のアイデンティティを共有する人と、敵対的なスレッド(D_flag=1)で同じ開示をする人では、まったく異なる挙動になります。
状態:Neutral → Disagreement → Identity Activation → Personalization → Ad Hominem → Dogpile
2.1で新たに追加:
- MPF(Moral Protective Framing:道徳的な保護フレーミング): 「子どもを守っている」といった倫理的なカバーとしてエスカレーションを隠す — 感情分析では検出されにくく、文脈上の状態認識が必要
- Adversarial Seeding(敵対的シーディング): 最初の返信が来る前に、T=0でエスカレーションした状態で生まれるスレッド
- Silence Bypass(沈黙のバイパス): ブロック/ミュートしてもローカルのスレッドだけが終了し、対立そのものは終わらない
- Transient Dogpile Groups(一時的なドッグパイル・グループ): グループは標的が変わってもD_flagを完全にはリセットしない
Reddit、Threads、WhatsApp(英語/ポルトガル語)で検証済み。次はPlaywrightスクレイパー+ML分類器を構築します。
論文:https://github.com/JohannaWeb/Monarch/releases/tag/2.1.paper
[link] [comments]