JSON-LDでコンピュータビジョンのデータセットに由来情報(プロベナンス)を埋め込む
arXiv cs.LG / 2026/3/31
💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- 本論文は、コンピュータビジョンのデータセットにおけるプロベナンス(由来情報)が、データの起源と変換履歴を追跡するためにますます重要になっていると主張している。これにより、データセットの保守、監査、再利用を支援する。
- それは一般的な課題として、プロベナンスがしばしば画像とは別に保存されている点を挙げている。その結果、撮影設定、前処理手順、モデル関連のメタデータといった重要な文脈が失われることがある。
- 提案する解決策では、JSON-LDを用いてプロベナンス情報を画像ファイル内に直接構造化して埋め込む。これにより、記述的メタデータが視覚データと本質的に結び付いたまま保持される。
- さらに、プロベナンスのスキーマをリンクトデータの標準に整合させることで、このアプローチは、後続のモデル学習におけるデータセット文書の保守性、適応性、整合性の向上を狙っている。
- 本研究は、視覚リソースとそのプロベナンスとの直接的なつながりを維持することを重視し、データセットの取り扱いおよびライフサイクル管理の際に情報損失を減らすことを目的としている。



