LabelSets — AI学習データのオープン品質標準(LQS v3.1)

Reddit r/MachineLearning / 2026/4/27

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • LabelSetsは、LQS v3.1というAI/ML学習データ向けのオープン品質標準を提案し、複数のスコアリングオラクルを用いてデータセットを評価します。
  • この手法では、下流のF1に対する信頼区間としてconformal prediction intervalを使い、さらにEd25519で署名した証明書と、40以上の公開評価に対する汚染(コンタミネーション)チェックを組み合わせます。
  • Hugging FaceのデータセットURLを貼り付けるだけで無料で監査でき、証明書は認証なしの検証APIで公開的に確認できます。
  • キャリブレーション用のコーパスは現在約1,000データセットで、2026年Q3までに約10,000へ拡大する目標が掲げられており、キャリブレーションが薄い場合は自信を“捏造”せずに明示します。
  • 著者は、ラベル次元、オラクル間の一致度(CohenとFleiss κ)、およびconformalキャリブレーションへのフィードバックを歓迎し、完全な仕様をCC BY 4.0の方法論ペーパーとして公開しています。

MLデータセット向けのサードパーティ製の品質評価システムを構築しました。マルチオラクル(5つのアルゴリズムファミリにまたがる7人のスコアラー)、下流のF1に対する共形予測区間、Ed25519で署名した証明書、そして40件以上の公開評価に対する汚染チェック(MMLU、HumanEval、GSM8K、MedQA、LegalBenchなど)を行っています。

手法に関する論文、CC BY 4.0: https://labelsets.ai/paper

無料監査(任意のHFデータセットURLを貼り付け): https://labelsets.ai/rate

公開検証API、認証なし: GET /api/verify-lqs-cert/:hash

キャリブレーション用コーパスは約1,000データセットで、2026年Q3までに10,000へ成長中です。キャリブレーションが薄いところでは、信頼を捏造するのではなく、証明書がそれをありのままに明記します。

次元リスト、オラクル合意の計算(Cohen + Fleiss κの報告)、あるいは共形予測のキャリブレーションについてフィードバックを歓迎します。手法論文には完全な仕様が記載されています——計算を誤っていた箇所があれば、ぜひ教えてください。

submitted by /u/plomii
[link] [comments]