Ollama(オラマ)は、自分のパソコンの中だけで AI(大規模言語モデル=LLM)を動かすための標準ツールです。クラウドの ChatGPT などと違い、データを外に出さずに使えるのが最大の特徴。インストールから初回のモデル実行まで 10〜15 分ほどで、「手元の PC で動く AI」が手に入ります。本ガイドは、はじめての人が迷わず動かし、選び、安全に使うところまでを図とともに案内します。
FIG.1 クラウド AI はデータを外部サーバーに送る。Ollama は手元の PC だけで完結する
01そもそも「ローカルで動かす」と何が良いのか
クラウドの AI は便利ですが、入力した文章は外部のサーバーに送られます。Ollama は AI 本体(モデル)を自分の PC にダウンロードして動かすので、入力も出力も手元から出ません。具体的なメリットは次の通りです。
プライバシー
入力したデータが外に出ない。社外秘の文章や個人情報を扱う場面で安心。
追加料金なし
API の従量課金が発生しない。動かすぶんの電気代だけ。何回呼んでも料金は増えません。
オフライン
一度モデルをダウンロードすれば、ネット接続がなくても動く。機内や出張先でも使える。
一方で万能ではありません。手元の PC の性能の範囲でしか動かせず、最高性能のクラウドモデル(後述)には及びません。「軽い作業・機密データ・実験用」をローカル、「最高精度が要る本番」をクラウド、と役割を分けるのが現実的です。
02必要なパソコンのスペック
AI モデルには「サイズ」があり、数字が大きいほど賢いぶん、必要なメモリ(RAM)と処理能力が増えます。サイズは B(ビリオン=10億パラメータ) という単位で表されます。下表は目安です。Mac の場合は CPU・GPU・メモリが一体(ユニファイドメモリ)なので、表の RAM をそのまま見てください。
| モデルサイズ | 目安の必要メモリ・速度感 |
|---|---|
| 1B〜4B(小型) | 8GB 程度。GPU なしでも動く。軽快。まず試すならここ |
| 7B〜8B(標準) | 16GB 程度。Apple Silicon(M1 以降)や RTX 3060 級で快適 |
| 12B〜14B(中型) | 24GB 程度。M2 Pro / RTX 4070 級。やや待つ場面も |
| 27B〜32B(大型) | 32GB 以上。M3 Max / RTX 4090 級が欲しい。重い |
数値は量子化(モデルを圧縮して軽くする技術。Ollama は標準で適用済み)の度合いでも変わるため、あくまで出発点です。迷ったらまず 4B 前後の小型モデルから始めるのが失敗しないコツ。動いてから大きいモデルに進めば、自分の PC の限界が体感でわかります。
03インストール
2026年現在、Ollama は公式デスクトップアプリが用意され、コマンドに不慣れな人でも導入しやすくなりました。macOS・Windows は公式サイト ollama.com からインストーラをダウンロードするのが一番簡単です。
アプリをダウンロード
macOS(12 以降)・Windows は ollama.com からインストーラを入手。Apple Silicon(M1 以降)推奨。Intel Mac は CPU のみで動作が遅く非推奨です。