「ChatGPT Images 2.0」発表、AIが"考えてから描く"画像生成モデル 日本語テキストもより正確に

ITmedia AI+ / 4/22/2026

📰 NewsSignals & Early TrendsTools & Practical UsageIndustry & Market MovesModels & Research

Key Points

  • OpenAIが画像生成モデル新版「ChatGPT Images 2.0」を発表し、生成前に構図や正確性を検討する“思考機能”を初めて搭載した。
  • 日本語を含む非ラテン文字の描画精度が大幅に向上し、より自然なテキスト表現が可能になった。
  • 4月21日からChatGPT、Codex、APIの全ユーザーに提供を開始し、Enterprise向けは近日リリース予定としている。
  • ChatGPT上で「Thinking」またはProモデルを選ぶと、リアルタイムWeb検索→自己の出力二重チェック→画像生成の流れで精度向上を図る。
  • 高度な画像出力(思考機能付き)はPlus/Pro/Businessの有料ユーザー向けに提供され、既存ワークフローの画像品質改善が見込まれる。

 米OpenAIは4月21日(現地時間)、画像生成モデルの新版「ChatGPT Images 2.0」を発表した。同社の画像モデルとして初めて思考機能を搭載し、生成前に構図や正確性を検討してから出力する。日本語を含む非ラテン文字の描画精度も大きく向上したという。

 同日からChatGPT、Codex、APIの全ユーザーに提供を開始。Enterprise向けも近日リリースする。

画像 編集部が作成した実際の使用例
画像 OpenAIの使用例より。日本語も自然に表示
画像
画像 写真の再現もリアルに
画像 ポスター風のデザインなども忠実に再現可能
画像 Macの画面でAAを表示、といった指示も再現する
画像 最新トレンドを反映したデザインも

 ChatGPTで「思考」(Thinking)またはProモデルを選ぶと、Webからリアルタイム情報を検索し、自身の出力を二重チェックした上で画像を生成できる。思考機能付きの高度な画像出力はChatGPT Plus、Pro、Businessの有料ユーザー向けだ。

 日本語、韓国語、中国語、ヒンディー語、ベンガル語など、非ラテン文字も正しくレンダリングし、自然な流れで表示できるという。小さな文字、アイコン、密集した構図などを高解像度で描画できる。ポスターや図表、マンガなど言語を含む画像もイメージ通りに生成するという。

 1つのプロンプトからキャラクターやオブジェクトの一貫性を保ちながら最大8枚の画像を同時に生成可能。マンガの連続ページや異なるアスペクト比・言語のSNS向け画像集など、従来は1枚ずつ生成して手作業でつなぎ合わせていたワークフローを一括で処理できる。

 モデルの学習データを2025年12月時点に更新した。API向けには「gpt-image-2」として提供を開始した。Codexでは別途APIキー設定なしで画像生成を利用できる。ただし、APIでの2Kを超える出力は現在β版で、一貫性のない結果が生じる場合がある。

関連記事

関連リンク

Copyright © ITmedia, Inc. All Rights Reserved.

続きを読むには、コメントの利用規約に同意し「アイティメディアID」および「ITmedia NEWS アンカーデスクマガジン」の登録が必要です