彼らのページでは、クレジットが16億だと言っていて、mimo v2.5 proはトークンあたり2クレジット、mimo v2.5はトークンあたり1クレジットだとしていますが、ここが彼らがあなたを引っかける方法です。キャッシュ済みトークンでも、往復(ラウンドトリップ)ごとに同じクレジットが請求されます。なので、CLIのコーディングには絶対に向いていません。というのも、設計上、彼らの1つ1つが必ずツールコールを行ったり来たりし続けるからです。そういう仕組みです。通常、推論プロバイダーは既存のキャッシュされたコンテキストに対して1%程度を請求しますが、Xiaomiは全額を取ります。私は深くない小さなタスクを10個ほどやっただけで、すでに使用済みクレジットが1200万(くらい)になっていました。おそらくコンテキストは100万未満で、そのミニ版のタスクは「こんにちはと言う」とか、「このフォルダを移動する」とか、「いくつかSQLを書く」とか、同じセッションで合計10個のプロンプト程度でした。クレジットのコストが雪だるま式に膨れ上がっていきます。こういう種類のことについて、トークンプランのドキュメントやどこにも何も書かれていません。大きなタスクだと、未キャッシュのトークンが2億トークンくらいで、mimo v2.5 proを使えばクレジットは4億になるでしょう。なので、最大100ドルのプランだと、月に4タスクまでしか使えません。正直、mimoトークン/コーディングプラン以上のものを使うと、40mトークンのタスク(入力+出力)だと、だいたい4億クレジットみたいな感じです。キャッシュヒット率は平均90%です。
[link] [comments]



