GPT-5.4 Thinking入門 — reasoning.effortとOSWorld-V 75%の推論AIをAPI活用
Zenn / 2026/4/11
💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- GPT-5.4 Thinkingの使い方を、推論の制御パラメータ(reasoning.effort)に焦点を当てて入門する内容です。
- reasoning.effortを調整することで、推論の“使う努力量”を段階的に変え、精度とコスト/応答性のバランスを取りやすくします。
- OSWorld-V 75%という推論AIの目標指標に言及し、API活用時にどのような推論品質を狙うかの指針になります。
- 実装・運用観点として、APIでの呼び出し設計(推論設定の組み込み)を進めるための実用的な手がかりを提供します。
はじめに
OpenAIのGPT-5.4 Thinkingは、2026年3月5日に発表された推論特化フラッグシップモデルです。従来のGPT-5.4(Computer Use / Tool Search 中心)とは異なり、段階的な推論制御と最大1Mトークンのコンテキストを武器に、AIエージェントの自律タスク実行を大幅に強化しています。
特に注目すべきは、デスクトップ自動化ベンチマークOSWorld-Verifiedで**75.0%**を達成し、人間ベースライン(72.4%)を超えたことです。これはGPT-5.2の47.3%から59%以上の改善であり、AIが実際の業務タスクをこなせるレベ...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



