物語生成における分布外デバイアス低減のための前処条件付けテスト時適応
arXiv cs.CL / 2026/3/17
📰 ニュースTools & Practical UsageModels & Research
要点
- 本研究では、高偏りのプロンプトが分布シフト(OOD)を構成すること、そしてこのシフトの下で静的なデバイアス低減モデルが劣化することを検証している。
- CAP-TTAを導入する。CAP-TTAは文脈を考慮したLoRA更新を、バイアスリスクのトリガーが閾値を超えた場合にのみ実行するテスト時適応フレームワークであり、更新を高速で安定させるために事前計算済みの対角前条件子を使用する。
- 有害プロンプトのベンチマークを横断して、CAP-TTAは人間評価によるバイアス低減を実現しつつ、AdamW/SGDよりもはるかに低い更新レイテンシを達成し、崩壊的忘却を緩和し、最先端のデバイアス除去ベースラインと比較して物語の流暢さを改善する。
- このアプローチは、分布シフト下でのデバイアスの有効性、流暢さ、効率のバランスを取りつつ、物語生成への実運用展望を重視している。
関連記事
Translator
Azure OpenAI Service ドキュメント
200人のChatGPTユーザーに聞いた最大の不満。トップ5はすべてChatGPT Toolboxが解決する問題だった。
Reddit r/artificial
すべてのPRをセキュリティバグでレビューするAIを作った — その方法(2026)
Dev.to
[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし
Reddit r/MachineLearning
私がリードを見つけ、個別化されたコールドメールを作成するAI SDRエージェントを構築した方法
Dev.to