DRG-Font:コントラスト的なスタイル・コンテンツの非対応化による動的参照誘導の少数ショットフォント生成
arXiv cs.CV / 2026/4/16
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文では、限られた参照から局所的なグリフ特性をより良く保持することを目的とした、動的参照誘導型の少数ショットフォント生成手法DRG-Fontを提案する。
- 埋め込み空間での非対応化(disentanglement)により、スタイル/形状の事前知識をそれぞれ異なる成分として分離し、スタイルとコンテンツ表現をコントラスト学習することで、スタイルの捉えを改善する。
- 参照選択(RS)モジュールを提案し、候補プールの中から最も適切なスタイル参照を動的に選び出すことで、より効果的なスタイル教師信号を実現する。
- アーキテクチャは、多スケールのスタイル/コンテンツヘッドブロック(MSHB/MCHB)と、多重フュージョンのアップサンプリングブロック(MFUB)を用いて、選択したスタイル事前知識とターゲットのコンテンツ事前知識を融合し、最終的なグリフを生成する。
- 著者らは、複数の視覚および解析ベンチマークにおいて、既存の最先端手法に対して大幅な性能向上を報告している。



