Ollama 完全ガイド：ローカル LLM の標準ツール

Ollama（オラマ）は、自分のパソコンの中だけで AI（大規模言語モデル＝LLM）を動かすための標準ツールです。クラウドの ChatGPT などと違い、データを外に出さずに使えるのが最大の特徴。インストールから初回のモデル実行まで 10〜15 分ほどで、「手元の PC で動く AI」が手に入ります。本ガイドは、はじめての人が迷わず動かし、選び、安全に使うところまでを図とともに案内します。

FIG.1　クラウド AI はデータを外部サーバーに送る。Ollama は手元の PC だけで完結する

01そもそも「ローカルで動かす」と何が良いのか

クラウドの AI は便利ですが、入力した文章は外部のサーバーに送られます。Ollama は AI 本体（モデル）を自分の PC にダウンロードして動かすので、入力も出力も手元から出ません。具体的なメリットは次の通りです。

プライバシー

入力したデータが外に出ない。社外秘の文章や個人情報を扱う場面で安心。

追加料金なし

API の従量課金が発生しない。動かすぶんの電気代だけ。何回呼んでも料金は増えません。

オフライン

一度モデルをダウンロードすれば、ネット接続がなくても動く。機内や出張先でも使える。

一方で万能ではありません。手元の PC の性能の範囲でしか動かせず、最高性能のクラウドモデル（後述）には及びません。「軽い作業・機密データ・実験用」をローカル、「最高精度が要る本番」をクラウド、と役割を分けるのが現実的です。

02必要なパソコンのスペック

AI モデルには「サイズ」があり、数字が大きいほど賢いぶん、必要なメモリ（RAM）と処理能力が増えます。サイズは B（ビリオン＝10億パラメータ） という単位で表されます。下表は目安です。Mac の場合は CPU・GPU・メモリが一体（ユニファイドメモリ）なので、表の RAM をそのまま見てください。

モデルサイズ	目安の必要メモリ・速度感
1B〜4B（小型）	8GB 程度。GPU なしでも動く。軽快。まず試すならここ
7B〜8B（標準）	16GB 程度。Apple Silicon（M1 以降）や RTX 3060 級で快適
12B〜14B（中型）	24GB 程度。M2 Pro / RTX 4070 級。やや待つ場面も
27B〜32B（大型）	32GB 以上。M3 Max / RTX 4090 級が欲しい。重い

数値は量子化（モデルを圧縮して軽くする技術。Ollama は標準で適用済み）の度合いでも変わるため、あくまで出発点です。迷ったらまず 4B 前後の小型モデルから始めるのが失敗しないコツ。動いてから大きいモデルに進めば、自分の PC の限界が体感でわかります。

03インストール

2026年現在、Ollama は公式デスクトップアプリが用意され、コマンドに不慣れな人でも導入しやすくなりました。macOS・Windows は公式サイト ollama.com からインストーラをダウンロードするのが一番簡単です。

アプリをダウンロード

macOS（12 以降）・Windows は ollama.com からインストーラを入手。Apple Silicon（M1 以降）推奨。Intel Mac は CPU のみで動作が遅く非推奨です。

Ollama 完全ガイド：ローカル LLM の標準ツール

要点

01そもそも「ローカルで動かす」と何が良いのか

02必要なパソコンのスペック

03インストール

アプリをダウンロード

続きを読むには無料登録が必要です

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer