JSON-LDでコンピュータビジョンのデータセットに由来情報（プロベナンス）を埋め込む

arXiv cs.LG / 2026/3/31

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、コンピュータビジョンのデータセットにおけるプロベナンス（由来情報）が、データの起源と変換履歴を追跡するためにますます重要になっていると主張している。これにより、データセットの保守、監査、再利用を支援する。
それは一般的な課題として、プロベナンスがしばしば画像とは別に保存されている点を挙げている。その結果、撮影設定、前処理手順、モデル関連のメタデータといった重要な文脈が失われることがある。
提案する解決策では、JSON-LDを用いてプロベナンス情報を画像ファイル内に直接構造化して埋め込む。これにより、記述的メタデータが視覚データと本質的に結び付いたまま保持される。
さらに、プロベナンスのスキーマをリンクトデータの標準に整合させることで、このアプローチは、後続のモデル学習におけるデータセット文書の保守性、適応性、整合性の向上を狙っている。
本研究は、視覚リソースとそのプロベナンスとの直接的なつながりを維持することを重視し、データセットの取り扱いおよびライフサイクル管理の際に情報損失を減らすことを目的としている。

Abstract

産業におけるコンピュータビジョンの普及に伴い、画像の出所（provenance）の重要性がより明確になってきています。出所は、たとえば画像データセットのようなあるリソースの起源および派生を示す情報を提供し、そのデータで学習された下流モデルが期待される挙動をよりよく理解するために、ユーザーがデータの変化を追跡できるようにします。また、出所は、コンプライアンスを保証し、監査を支援し、再利用性を高めることで、データの保守にも役立ちます。一般に、出所が提供される場合、それは別に保存されます（たとえばテキストファイル内など）。その結果、画像撮影の設定、データ前処理の手順、モデルのアーキテクチャや反復といった重要な詳細に関する記述情報が失われます。画像には、作成やコンパイルのパラメータを説明する情報が欠けていることがよくあります。本論文では、画像の出所を管理可能で首尾一貫した形式で構造化するための新しいスキーマを提案します。このアプローチでは、Linked Data（JSON-LD）のためのJavaScript Object Notationを用い、この出所情報を画像ファイルそのものに埋め込みます。これにより、次の2つの重要な利点が得られます。 (1) 画像の説明を、確立された標準に着想を得てそれらにリンクされた堅牢なスキーマに整合させること、そして (2) 出所を画像と本質的に結びついたままにし、情報の喪失を防いで、システム特性、たとえば保守性や適応性を向上させること。本アプローチは、ビジョンリソースとその出所との直接的なつながりを維持することを重視しています。