76,000枚の写真を52ドルで説明できるGPT‑5.4 miniとGPT‑5.4 nano

Simon Willison's Blog / 2026/3/18

📰 ニュースTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • OpenAIは、GPT‑5.4に追加されるGPT‑5.4 miniとnanoを発表し、初期のGPT‑5.4のリリースからわずか2週間後に公開されました。
  • GPT‑5.4-nanoは最大推論能力の点でGPT‑5.4-miniを上回ると報じられ、ミニは以前より2倍速くなっています。
  • この投稿にはnanoとminiのコストを示すトークンベースの価格表が含まれており、特定のワークロードではnanoがGoogle Gemini 3.1 Flash-Liteより安いと記載されています。
  • 実用的な例としてGPT‑5.4-nanoが実際の写真を説明する様子が示され、実世界での使用と速度を示しています。
スポンサー: CodeRabbit — Planner は再作業と AI の混乱を最小化しつつ、コーディングエージェントを10倍にします。 今すぐ試す.

GPT-5.4 mini および GPT-5.4 nano、$52 で 76,000 枚の写真を説明できる

2026年3月17日

OpenAI today: GPT‑5.4 mini と nano の導入。これらのモデルは、2 週間前に公開された GPT-5.4 に続くものです。

OpenAI の自己申告ベンチマークは、新しい 5.4-nano が最大推論性能で従来の GPT-5 mini モデルを上回ることを示しています。新しい mini も従来の mini より 2 倍速いです。

価格は以下のとおりです—すべての価格は百万トークンあたりです。 gpt-5.4-nano は Google の Gemini 3.1 Flash-Lite よりも格段に安いです:

モデル 入力 キャッシュ済み入力 出力
gpt-5.4 $2.50 $0.25 $15.00
gpt-5.4-mini $0.75 $0.075 $4.50
gpt-5.4-nano $0.20 $0.02 $1.25
比較用のその他のモデル
Claude Opus 4.6 $5.00 - $25.00
Claude Sonnet 4.6 $3.00 - $15.00
Gemini 3.1 Pro $2.00 - $12.00
Claude Haiku 4.5 $1.00 - $5.00
Gemini 3.1 Flash-Lite $0.25 - $1.50

この写真の説明を生成するために John M. Mossman Lock Collection で撮影した写真です:

\"下の説明\"

llm -m gpt-5.4-nano -a IMG_2324.jpeg 'describe image'

以下が出力です:

この画像は、長さがある展示壁を持つ美術館のギャラリーの内部を示しています。白く塗られた煉瓦の壁は、整然と並んだ多くの額入り肖像で覆われています。肖像の下には、暗い木製のフレームとガラスの顶部/フロントを持つ複数のガラス展示ケースが並び、さまざまな古い歴史的物品や機器が収められています。部屋には磨き上げられた木製の床、吊るされた天井ライト/コード、壁の上部近くに見えるパイプがいくつかあります。前景には、ガラスケースが部屋の長さに沿って並び、ギャラリーの他のセクションの品物を反射しています。

これには 2,751 入力トークンと 112 出力トークンがかかり、コストは 0.069 セント(0.1 セント未満)でした。つまり、76,000 枚の写真コレクションの全ての写真を説明するには約 $52.44 かかる計算です。

新しいモデルをサポートした llm 0.29 をリリースしました。

それから OpenAI Codex に 5 段階の推論努力レベルと 3 つのモデルをすべてループさせ、このペリカンが自転車に乗っている組み合わせ SVG グリッドを作成しました(生成の転写はこちら)。私は gpt-5.4 xhigh のものが一番好きです。良い自転車(美しいスポーク)を持ち、ペリカンはくちばしに魚をくわえています!

\"Claude

投稿 2026年3月17日 19:39 · 私をフォローするには MastodonBlueskyTwitter、または ニュースレターを購読

This is GPT-5.4 mini and GPT-5.4 nano, which can describe 76,000 photos for $52 by Simon Willison, posted on 17th March 2026.

ai 1916 openai 402 generative-ai 1699 llms 1665 llm 565 vision-llms 84 llm-pricing 67 pelican-riding-a-bicycle 101 llm-release 185

Previous: My fireside chat about agentic engineering at the Pragmatic Summit

月次ブリーフィング

Sponsor me for $10/month and get a curated email digest of the month's most important LLM developments.

Pay me to send you less!

スポンサーになる & 購読