OmniCompliance-100K: 複数ドメインにまたがる、規則に基づく実世界の安全コンプライアンスデータセット

arXiv cs.CL / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

OmniCompliance-100Kは、LLM向けの大規模で規則根拠のある安全データセットで、12,985の規則と106,009の関連する実世界のコンプライアンス事例を含む。
データセットは、セキュリティ、プライバシー、コンテンツ安全性、金融セキュリティ、医療機器リスク管理、教育の公正性、人権保護など、さまざまな領域にまたがる74の規制・方針を網羅しています。
実世界の関連性を確保するためにウェブ検索エージェントを用いて収集され、従来のアドホックな安全データ分類のギャップに対処します。
異なるモデル規模にわたるベンチマーク実験は、今後のLLMの安全性研究開発を導く洞察を提供します。

要約: 大規模言語モデル（LLMs）の安全性と適合性を確保することは、極めて重要です。しかし、既存のLLMs安全データセットは多くの場合、データ生成のためのアドホックな分類法に依存しており、LLMsを堅牢に保護するために不可欠な、規則に基づいた実世界のケースが大幅な不足に悩まされています。本研究では、コンプライアンスの観点から包括的な安全データセットを構築することで、この重要なギャップに対処します。強力なウェブ検索エージェントを用いて、複数ドメインの権威ある参考文献から出典された、規則に基づく実世界のケースデータセット OmniCompliance-100K を収集します。データセットは、74 の規制とポリシーを横断して、セキュリティとプライバシー規制、主要なAI企業およびソーシャルメディアプラットフォームのコンテンツ安全性とユーザーデータプライバシーポリシー、財務セキュリティ要件、医療機器リスク管理基準、教育の整合性ガイドライン、基本的人権の保護など、広範な領域にわたります。総計で、当データセットには 12,985 件の異なる規則と 106,009 件の関連する実世界のコンプライアンスケースが含まれています。私たちの分析は、規則とそれに対応するケースの間に強い整合性があることを確認しています。さらに、異なるモデル規模にわたる高度なLLMの安全性とコンプライアンス能力を評価する包括的なベンチマーク実験を実施します。我々の実験は、将来のLLM安全性研究に有益な貴重な洞察を提供する可能性を秘めた、いくつかの興味深い発見を明らかにしています。

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

日経XTECH

機械学習・ディープラーニングにおける数学の必要性

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

Santa Augmentcode Intent Ep.6

Dev.to

あなたのエージェントが別のエージェントを雇った。出力はゴミだった。金も消えた。

Dev.to

OmniCompliance-100K: 複数ドメインにまたがる、規則に基づく実世界の安全コンプライアンスデータセット

要点

関連記事

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

機械学習・ディープラーニングにおける数学の必要性

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

Santa Augmentcode Intent Ep.6

あなたのエージェントが別のエージェントを雇った。出力はゴミだった。金も消えた。

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer