LabelSets — AI学習データのオープン品質標準（LQS v3.1）

Reddit r/MachineLearning / 2026/4/27

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

共有:

要点

LabelSetsは、LQS v3.1というAI/ML学習データ向けのオープン品質標準を提案し、複数のスコアリングオラクルを用いてデータセットを評価します。
この手法では、下流のF1に対する信頼区間としてconformal prediction intervalを使い、さらにEd25519で署名した証明書と、40以上の公開評価に対する汚染（コンタミネーション）チェックを組み合わせます。
Hugging FaceのデータセットURLを貼り付けるだけで無料で監査でき、証明書は認証なしの検証APIで公開的に確認できます。
キャリブレーション用のコーパスは現在約1,000データセットで、2026年Q3までに約10,000へ拡大する目標が掲げられており、キャリブレーションが薄い場合は自信を“捏造”せずに明示します。
著者は、ラベル次元、オラクル間の一致度（CohenとFleiss κ）、およびconformalキャリブレーションへのフィードバックを歓迎し、完全な仕様をCC BY 4.0の方法論ペーパーとして公開しています。

MLデータセット向けのサードパーティ製の品質評価システムを構築しました。マルチオラクル（5つのアルゴリズムファミリにまたがる7人のスコアラー）、下流のF1に対する共形予測区間、Ed25519で署名した証明書、そして40件以上の公開評価に対する汚染チェック（MMLU、HumanEval、GSM8K、MedQA、LegalBenchなど）を行っています。

手法に関する論文、CC BY 4.0: https://labelsets.ai/paper

無料監査（任意のHFデータセットURLを貼り付け）: https://labelsets.ai/rate

公開検証API、認証なし: GET /api/verify-lqs-cert/:hash

キャリブレーション用コーパスは約1,000データセットで、2026年Q3までに10,000へ成長中です。キャリブレーションが薄いところでは、信頼を捏造するのではなく、証明書がそれをありのままに明記します。

次元リスト、オラクル合意の計算（Cohen + Fleiss κの報告）、あるいは共形予測のキャリブレーションについてフィードバックを歓迎します。手法論文には完全な仕様が記載されています——計算を誤っていた箇所があれば、ぜひ教えてください。

submitted by /u/plomii
[link] [comments]