触覚グラフィックスの自動的な細粒度評価と編集への一歩:TactileEval
arXiv cs.CV / 2026/4/23
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- TactileEvalは、既存データセットが粗い全体品質スコアしか提供せず修正に直結する手がかりがないという課題に対し、触覚グラフィックスの細粒度な評価と修復を自動化するための3段階パイプラインを提案しています。
- 本研究では、専門家の自由記述コメントから得られ、BANA基準に整合する5つの品質カテゴリ(視点角度、部品の完全性、背景の雑多さ、テクスチャの分離、線の品質)に基づくタクソノミーを構築します。
- さらに、Amazon Mechanical Turkを用いて66の物体クラスに対し1万4,095件の構造化アノテーションを収集し、6つの物体ファミリーに整理して評価と編集の両方を可能にします。
- 構築したデータで学習した再現可能なViT-L/14の特徴プローブは、30のタスクにわたって全体テスト精度85.70%を達成し、さらに一貫した難易度の順序付けから、タクソノミーが意味のある知覚構造を捉えていることを示唆します。
- これらの評価を土台に、ViTで分類スコアをファミリー固有のプロンプトテンプレートに振り分け、gpt-image-1による画像編集で狙った修正を生成する自動編集パイプラインも提示しています。




