ExpressEdit: Fast Editing of Stylized Facial Expressions with Diffusion Models in Photoshop

arXiv cs.CV / 4/7/2026

📰 NewsSignals & Early TrendsTools & Practical UsageModels & Research

Key Points

  • 提案論文は、既存のAI画像編集が編集結果にグローバルノイズやピクセルドリフトを生み、プロのワークフローに統合しにくい点を課題として挙げ、これを抑える方式としてExpressEditを紹介しています。
  • ExpressEditはPhotoshop用の完全オープンソースプラグインで、LiquifyなどPhotoshopネイティブ機能と自然に組み合わせながら、単一の一般的なGPUで約3秒という高速な表情編集を実現します。
  • 多様な表情生成を物語ニーズに合わせて行うために、135の「表情タグ」からなる表情データベース(ストーリー例と画像付き)を構築し、検索・補強(RAG)により編集や生成を支援します。
  • コードとデータセットをオープンソース化することで、今後の研究や制作(アーティストの表現探求)を促進することを目的としています。

Abstract

Facial expressions of characters are a vital component of visual storytelling. While current AI image editing models hold promise for assisting artists in the task of stylized expression editing, these models introduce global noise and pixel drift into the edited image, preventing the integration of these models into professional image editing software and workflows. To bridge this gap, we introduce ExpressEdit, a fully open-source Photoshop plugin that is free from common artifacts of proprietary image editing models and robustly synergizes with native Photoshop operations such as Liquify. ExpressEdit seamlessly edits an expression within 3 seconds on a single consumer-grade GPU, significantly faster than popular proprietary models. Moreover, to support the generation of diverse expressions according to different narrative needs, we compile a comprehensive expression database of 135 expression tags enriched with example stories and images designed for retrieval-augmented generation. We open source the code and dataset to facilitate future research and artistic exploration.