要旨: テキスト指示によるテクスチャ編集は、基盤となる幾何学的構造を保ちながら対象の外観を変更することを目的としています。 しかし、我々の経験的分析は、最先端の編集モデルでさえ、外観変更が純粋に見た目に関連するものであるにもかかわらず、テクスチャ編集中の構造的一貫性を維持するのにしばしば苦労することを示しています。 この観察に動機づけられ、データとトレーニングの両方の観点から構造保存を共同で強化し、Qwen-Image-Edit-2509をベースとした専用のテクスチャ編集モデルTexEditorを構築します。 第一に、Blenderを用いて生成された高品質なSFTデータセットTexBlenderを構築します。これはコールドスタートに対して強力な構造的事前情報を提供します。 次に、SFT中に学習した構造的事前情報を実世界のシーンへ転送するため、構造を維持する損失を組み込んだRLベースのアプローチStructureNFTを導入します。 さらに、既存のベンチマークの現実味と評価カバー範囲が限定的であることから、TexBenchを導入します。TexBenchはテキスト指示付きテクスチャ編集の汎用実世界ベンチマークです。 Blenderベースの既存のテクスチャベンチマークとTexBenchを用いた大規模な実験の結果、TexEditorはNano Banana Proといった強力なベースラインを一貫して上回ることを示しています。 さらに、TexEditorを汎用ベンチマークImgEditで評価し、その汎化性能を検証します。 私たちのコードとデータは https://github.com/KlingAIResearch/TexEditor で入手可能です。
TexEditor: 構造を保持するテキスト駆動のテクスチャ編集
arXiv cs.CV / 2026/3/20
📰 ニュースTools & Practical UsageModels & Research
要点
- TexEditor は、基盤となる幾何学的構造を保持しつつ、テキストによって外観を変更することを目指す専用のテクスチャ編集モデルです。
- 著者らは、Blender を用いて生成した高品質な SFT データセットである TexBlender を構築し、コールドスタート編集に対して強力な構造的事前情報を提供します。
- 彼らは StructureNFT を提案します。これは、構造を保持する損失を用いた RL ベースのアプローチで、学習済みの事前情報を現実世界のシーンへ転送します。
- また、既存の Blender ベースのデータセットを超えた、テキスト誘導型テクスチャ編集をより良く評価するための汎用的な実世界ベンチマーク TexBench を提案します。
- 実験では、TexEditor が Blender ベンチマークおよび TexBench の強力なベースラインを一貫して上回り、一般化の検証として ImgEdit による評価も行われた。コードとデータは GitHub で公開されています。
関連記事
Translator
Azure OpenAI Service ドキュメント
200人のChatGPTユーザーに聞いた最大の不満。トップ5はすべてChatGPT Toolboxが解決する問題だった。
Reddit r/artificial
すべてのPRをセキュリティバグでレビューするAIを作った — その方法(2026)
Dev.to
[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし
Reddit r/MachineLearning
私がリードを見つけ、個別化されたコールドメールを作成するAI SDRエージェントを構築した方法
Dev.to