Ollama 完全ガイド:ローカル LLM の標準ツール

AI Navigate Original / 2026/5/16

共有:

要点

  • Ollama はローカル LLM の標準ツールで数分で動く
  • 利点:プライバシー・API 無料・オフライン・カスタム・制限なし
  • モデルサイズ別スペック、localhost:11434 で OpenAI 互換 API
  • Modelfile でカスタム、API フラッグシップには及ばない

Ollama(オラマ)は、自分のパソコンの中だけで AI(大規模言語モデル=LLM)を動かすための標準ツールです。クラウドの ChatGPT などと違い、データを外に出さずに使えるのが最大の特徴。インストールから初回のモデル実行まで 10〜15 分ほどで、「手元の PC で動く AI」が手に入ります。本ガイドは、はじめての人が迷わず動かし、選び、安全に使うところまでを図とともに案内します。

クラウド AI あなた 外部サーバー ローカル AI(Ollama) あなた 自分の PC LLM がここで動く

FIG.1 クラウド AI はデータを外部サーバーに送る。Ollama は手元の PC だけで完結する

01そもそも「ローカルで動かす」と何が良いのか

クラウドの AI は便利ですが、入力した文章は外部のサーバーに送られます。Ollama は AI 本体(モデル)を自分の PC にダウンロードして動かすので、入力も出力も手元から出ません。具体的なメリットは次の通りです。

プライバシー

入力したデータが外に出ない。社外秘の文章や個人情報を扱う場面で安心。

追加料金なし

API の従量課金が発生しない。動かすぶんの電気代だけ。何回呼んでも料金は増えません。

オフライン

一度モデルをダウンロードすれば、ネット接続がなくても動く。機内や出張先でも使える。

一方で万能ではありません。手元の PC の性能の範囲でしか動かせず、最高性能のクラウドモデル(後述)には及びません。「軽い作業・機密データ・実験用」をローカル、「最高精度が要る本番」をクラウド、と役割を分けるのが現実的です。

02必要なパソコンのスペック

AI モデルには「サイズ」があり、数字が大きいほど賢いぶん、必要なメモリ(RAM)と処理能力が増えます。サイズは B(ビリオン=10億パラメータ) という単位で表されます。下表は目安です。Mac の場合は CPU・GPU・メモリが一体(ユニファイドメモリ)なので、表の RAM をそのまま見てください。

モデルサイズ目安の必要メモリ・速度感
1B〜4B(小型)8GB 程度。GPU なしでも動く。軽快。まず試すならここ
7B〜8B(標準)16GB 程度。Apple Silicon(M1 以降)や RTX 3060 級で快適
12B〜14B(中型)24GB 程度。M2 Pro / RTX 4070 級。やや待つ場面も
27B〜32B(大型)32GB 以上。M3 Max / RTX 4090 級が欲しい。重い

数値は量子化(モデルを圧縮して軽くする技術。Ollama は標準で適用済み)の度合いでも変わるため、あくまで出発点です。迷ったらまず 4B 前後の小型モデルから始めるのが失敗しないコツ。動いてから大きいモデルに進めば、自分の PC の限界が体感でわかります。

03インストール

2026年現在、Ollama は公式デスクトップアプリが用意され、コマンドに不慣れな人でも導入しやすくなりました。macOS・Windows は公式サイト ollama.com からインストーラをダウンロードするのが一番簡単です。

01

アプリをダウンロード

macOS(12 以降)・Windows は ollama.com からインストーラを入手。Apple Silicon(M1 以降)推奨。Intel Mac は CPU のみで動作が遅く非推奨です。

続きを読むには無料登録が必要です

アカウントを作成すると、オリジナル記事の全文をお読みいただけます。