CBRS:二言語データセットとデュアルレイヤー・フィルタリングによるマルチプラットフォームSNS向け「認知的血液要請システム」
arXiv cs.CL / 2026/4/21
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- 大量のSNSコミュニケーションの中から緊急の献血(血液提供)要請投稿やメッセージを自動的に抽出・解析し、見逃しと対応遅延を減らすためのマルチプラットフォーム・システム「CBRS」を提案しています。
- ベンガル語・英語に加え、ベンガル語のトランスリテレーション(表記転写)を含む1万1,000件規模のデータセットを新たに構築し、実際のソーシャル投稿に近い言語多様性を反映しています。
- CBRSはコスト効率の良いデュアルレイヤー構成によりフィルタリングを行い、さらにアドバーサリアルなネガティブ例を用いることで検出の頑健性を高めています。
- フィルタリングでは99%の精度・適合率(precision)を達成し、解析タスクではLoRAで微調整したLlama-3.2-3Bがゼロショットで92%の精度を報告しており、ベースモデルより41.54%向上し、GPT-4o-miniやGemini-2.0-Flash等の少数ショット性能も上回るとしています。
- コード、データセット、学習済みモデルを公開しており、時間に制約のある対象(要望)特定タスクにおける、スケーラブルかつ包摂的な情報抽出の基盤を提供します。




