要旨: 最近の自己回帰トランスフォーマーの進展は、芸術家品質のメッシュを生成する驚くべき可能性を示してきました。しかし、既存手法で用いられているトークン順序付けの戦略は、座標ベースのソートが非効率的に非常に長い系列を生み、パッチベースのヒューリスティックが高品質なモデリングに不可欠な連続的なエッジフローと構造的な規則性を破壊するという点で、プロのアーティスト基準を通常満たしません。これらの制限に対処するために、我々は三角形ストリップに着想を得たトークン順序付け戦略を持つ、新しい枠組み Strips as Tokens (SATO) を提案します。UV境界を明示的に符号化する、面の連結された鎖として系列を構築することで、本手法はアーティストが作成したメッシュに特徴的な整理されたエッジフローと意味的レイアウトを自然に保持します。この定式化の重要な利点は、表現が統一されていることであり、同じトークン系列を三角形メッシュまたは四角形メッシュのいずれにも復号できる点です。この柔軟性により、両データ型に対する共同学習が可能になります。大規模な三角形データは基本的な構造的事前知識を提供し、一方で高品質な四角形データは出力の幾何学的な規則性を高めます。大規模な実験により、SATO が幾何学的品質、構造的な一貫性、UVセグメンテーションの観点で、先行手法を一貫して上回ることが示されています。
Strips as Tokens:ネイティブUVセグメンテーションによるアーティスト品質のメッシュ生成
arXiv cs.CV / 2026/4/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、自己回帰トランスフォーマー向けの新しいトークン順序付けフレームワーク「Strips as Tokens(SATO)」を導入し、アーティスト品質の3Dメッシュを生成する。
- 位置のソートやパッチに関するヒューリスティックに依存する先行手法とは異なり、SATOは三角ストリップに着想を得た連結面のチェーンを用い、UV境界を明示的に符号化することで、エッジの流れと構造的な規則性を保持する。
- SATOは、三角形または四角形のメッシュへ復号可能な統一トークン表現を採用しており、同一のシーケンスから出力形式を柔軟に切り替えられる。
- 本手法は共同学習(joint training)を意図しており、大規模な三角形データセットが構造に関する事前知識の基盤を提供し、高品質な四角形データセットが幾何学的な規則性を高める。
- 著者らが報告した実験結果によれば、SATOは幾何学的品質、構造的一貫性、UVセグメンテーション精度の各観点で既存手法を上回る。




