SANA I2I：対応画像からの画像翻訳のためのテキストフリー・フリーフロー・マッチングフレームワーク ― 胎児MRIのアーティファクト低減のケーススタディ

arXiv cs.AI / 2026/4/2

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、テキストによる条件付けを取り除き、ソース画像とターゲット画像の対応ペアからのみ学習する、テキストフリーの対応画像から画像への翻訳フレームワークSANA-I2Iを提案する。
SANAの系譜を拡張し、潜在空間において条件付きフローマッチングモデルを学習することで、ソース画像分布をターゲット画像分布へ変換する速度場を学習する。
本手法は、胎児MRIのモーション・アーティファクト低減で評価される。ここでは、解剖学的構造を保持しつつアーティファクトを抑制することが特に困難である。
実際の対応ペアとなる胎児MRIデータを得る難しさに対処するため、著者らは先行研究に基づくアプローチを用いて現実的なモーション・アーティファクトをシミュレーションし、合成の対応ペア学習データを生成する。
結果として、少数の推論ステップで競争力のある品質を維持しつつアーティファクト抑制が有効であることが示されており、フローに基づくテキストフリーのモデルは教師あり医用画像翻訳タスクに適していることが示唆される。

概要: 私たちは、テキストによる条件付けを完全に取り除くことでSANAファミリーを拡張する、テキスト不要の高解像度な画像から画像への生成フレームワークであるSANA-I2Iを提案します。テキストと画像ベースの制御を組み合わせるSanaControlNetとは対照的に、SANA-I2Iは潜在空間での条件付きフローマッチングモデルを学習するために、対になったソース画像とターゲット画像のみに依存します。このモデルは、ターゲット画像の分布を別の分布へ写像する条件付き速度場を学習し、それによって言語プロンプトに依存しない教師あり画像翻訳を可能にします。提案手法を、胎児MRIのモーションアーチファクト低減という難しい課題で評価します。本アプリケーションでは実際の対データを取得することが難しいため、Duffyらによって提案された手法に基づく合成データ生成戦略を採用し、胎児の磁気共鳴画像（MRI）における現実的なモーションアーチファクトをシミュレートします。実験結果は、SANA-I2Iが運動によるアーチファクトを抑制しつつ解剖学的構造を保持し、少数の推論ステップで競争力のある性能を達成することを示しています。これらの結果は、医用画像における教師あり画像から画像へのタスクに対して、提案するフローベースのテキスト不要生成モデルが効率的で適していることを示しています。