AI ベンダーは数が多く、デモはどれも魔法のように見えます。けれど契約してから「自社のデータでは精度が出ない」「請求が読めない」「乗り換えられない」と気づくと、戻すのは大変です。この記事は、初めて AI ベンダーを選ぶ人がデモの印象ではなく事実で選ぶための基準と、よくある落とし穴を、図とともに整理します。
FIG.1 モデルが同じでも、入力データの質が違えば結果は別物になる
大事な前提をひとつ。「どのベンダーが一番賢いか」より「自社の課題と自社のデータで成果が出るか」のほうが、はるかに結果を左右します。だから比較は、ベンダーのスライドではなく、あなたのデータで行うのが原則です。
01選ぶ前に「評価指標」を決める
最初にやりがちな失敗が、指標を決める前にデモを見てしまうことです。魅力的な画面を見たあとでは、判断が「印象」に引っ張られます。順番を逆にしましょう。解きたい課題と、合格ラインの数字を先に紙に書く。これだけで比較がぶれなくなります。
課題を1つに絞る
「問い合わせ一次対応の自動化」「契約書レビューの下読み」など、業務を具体的に1つ決める。範囲を広げすぎると評価できない。
合格ラインを数字で書く
例:正答率80%以上、1件あたり処理コスト◯円以下、応答3秒以内。あいまいな「賢ければOK」では比較できない。
評価用の問題集を作る
自社の実データから30〜100問の想定質問と正解を用意。これが全ベンダー共通の“ものさし”になる。
この問題集は、契約後の運用でも品質を測り続ける資産になります。最初に作る手間を惜しまないのがコツです。
02評価すべき7つの軸
指標が決まったら、各ベンダーを同じ観点で並べます。次の7軸が実務での定番です。値はベンダーのうたい文句ではなく、契約書・公式ドキュメント・自社PoCで裏を取ります。
1. 精度の実証
自社データでのPoC結果で判断。ベンダー提供の好例(チェリーピック)だけで決めない。
2. データの扱い
入力が学習に使われないか、どこに・どれだけ保存されるか。契約条項で確認(詳細は次章)。
3. セキュリティ認証
SOC 2 Type II、ISO 27001、医療なら HIPAA とBAA。有効期限内の報告書を出せるか。
4. 運用サポート
障害時のSLA(復旧目標)、問い合わせ窓口、日本語対応や時差の体制。
5. 価格体系
従量課金の上振れリスク、最低利用料、隠れた追加費(後述)。
6. ロックイン
移行のしやすさ、データのエクスポート可否、独自仕様への依存度。
7. 事業継続性
提供元の財務・継続性。小規模スタートアップ単独依存のリスクを見積もる。
03データの扱い:契約で確認すべきこと
ここは誤解が多い場所です。2026年時点で、主要な法人向けAPI(OpenAI・Anthropic・Azure OpenAI など)は、入力データを既定でモデルの再学習に使いません。「APIに送ると勝手に学習される」というのは、少なくとも法人プランでは正確ではありません。ただし安心して任せきりにせず、次の3点は自分で公式ドキュメントと契約(DPA)で確認します。
- 再学習への不使用:法人APIは既定で非学習。一方、無料の一般向けチャットは扱いが異なることがある(業務データを貼らない運用が無難)。
- 保存期間:不正監視のため一定期間(例:最大30日程度)保持→削除、という運用が一般的。期間と削除条件を確認する。
- ゼロデータ保持(ZDR):機微なデータでは「処理後に残さない」ZDR を選べる場合がある。ただし対象プラン・申請の要否は提供元で異なるため、必ず契約・公式手続きで裏を取る。
「学習に使われない」を口頭ではなく契約条項(DPA)で確認できるか——これが法人利用の分かれ目。