MiniMax が M2.7 を新たにリリースしました — そして今、BlockRun でライブ公開されています。
API 呼び出しは 1 回のみ。リクエストごとに課金。サブスクリプションなし。MiniMax での API キー登録は不要。
curl https://blockrun.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "minimax/minimax-m2.7",
"messages": [{"role": "user", "content": "Hello"}]
}'
まだ minimax/minimax-m2.5 を利用している場合、それは自動的に M2.7 にリダイレクトされます。コードの変更は不要です。
M2.7 が他と違う点
M2.7 は、MiniMax が初めて「自らの進化に深く関与する」モデルとして説明するものです。単にエージェントのタスクを実行するだけでなく、再帰的な自己改善ループを通じて、自身のエージェント活用基盤を構築・最適化します。
実際には、以下を意味します:
- 97% のスキル適合(40 以上の複雑なスキルにまたがり、各スキルは 2,000 トークンを超える)
- 再帰的ハーネス最適化による約 30% のパフォーマンス向上、100 回以上の反復サイクルで
- 自律的に 研究ワークフローの 30–50% を処理します
これはチャットボットのアップグレードではありません。代わりに、エージェントとしてより多く使えば使うほど、エージェントとしての能力が向上するモデルです。
重要なベンチマーク
ソフトウェア工学
| ベンチマーク | M2.7 | 文脈 |
|---|---|---|
| SWE-Pro | 56.22% | GPT-5.3-Codex に匹敵 |
| VIBE-Pro | 55.6% | エンドツーエンドのプロジェクト納品 |
| Terminal Bench 2 | 57.0% | 複雑なエンジニアリングシステム |
| SWE Multilingual | 76.5 | 多言語コードタスク |
| Multi SWE Bench | 52.7 | 複数リポジトリのエンジニアリング |
機械学習と研究
MLE Bench Lite(22 件 Kaggle 風コンペ): 66.6% の平均メダル獲得率 — Opus 4.6(75.7%)と GPT-5.4(71.2%)に次ぐ2位。最高の単一実行: 金9、銀5、銅1。
プロフェッショナル生産性
| ベンチマーク | M2.7 | 文脈 |
|---|---|---|
| GDPval-AA ELO | 1495 | オープンソースモデルの中で最高 |
| Toolathon | 46.3% | ツール活用精度 |
| MM Claw | 62.7% | Sonnet 4.6 レベルに近い |
本番デバッグのベンチマークは、インシデント復旧時間を3分未満と示しています — ログ分析、セキュリティ監査、システム理解のための SRE レベルの意思決定。
M2.7 における新機能と M2.5 の比較
- ネイティブエージェントチーム — モデルに組み込まれた複数エージェントの協調機能、後から追加されたものではありません





