データセット・マーケットプレイス向けにラベル品質スコア(LQS)システムを構築し、無料のスタンドアロンツールとして公開しました。
データセットをアップロード → 品質を低下させているものを特定するフラグ付きで、7つの次元に分解された0〜100のスコアを取得。
CSV、Parquet、JSONL、COCO JSON、YOLOに対応 — ほとんどの一般的なML形式。
リンク: labelsets.ai/quality-audit
何かを売り込みたいわけではありません。本当に、データセットをプロとして扱っている人にとってこの採点が筋が通っているのかを知りたいです。コメント欄で手法について議論するのは大歓迎です。
[link] [comments]



