Banana100: ナノ・バナナ・プロによる100回の反復的な画像複製でNR-IQA指標を破る

arXiv cs.CV / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 論文は、マルチターンのマルチモーダル画像編集における重要な失敗モードを特定する。すなわち、編集を繰り返すことで生じる反復的な劣化が蓄積し、目に見えるノイズとなって現れ、単純な指示でさえも遵守できなくなる可能性がある。
  • 100回の反復的な編集ステップを用いて多様な質感や画像内容にまたがる28,000枚の画像から成る新しいデータセットBanana100を提案し、特にこの劣化現象を対象としている。
  • 著者らは、代表的な無参照画像品質評価(NR-IQA)指標が、強く劣化した画像を確実に検知できないことを報告している。21の人気指標のいずれも、劣化画像をクリーンな画像より一貫して低いスコアにできていない。
  • 画像生成器側でも評価器側でも二重に破綻が見られることから、学習安定性と、低品質な合成出力が品質フィルタをすり抜ける場合にエージェント型システムの安全性が損なわれる懸念が提起される。
  • 著者らは、より堅牢な編集システムや、マルチターンのエージェント型ワークフローにおける信頼性の高い品質評価を構築するためのコードとデータを公開している。