学習・推論・ファインチューニング:3 段階を初学者向けに分解

AI Navigate Original / 2026/4/27

💬 オピニオンTools & Practical UsageModels & Research
共有:

要点

  • LLM のライフサイクル:事前学習・追加学習・推論
  • 事前学習は巨額、追加学習は SFT/RLHF/DPO/Constitutional AI
  • 推論の累積コストが学習を上回ることが多い
  • 実務で FT は限定的、RAG と使い分け、LoRA が現実解

ChatGPT や Claude のような LLM(大規模言語モデル)は、いきなり完成品として生まれるわけではありません。「事前学習 → 追加学習 → 推論」という 3 つの段階を順番に通って、ようやく私たちが使える形になります。この記事では、その 3 段階を初めての人でも分かるように分解し、「ファインチューニング」がどこに位置するのか、そして実務で耳にする RAG との使い分けまで、図を交えて整理します。

事前学習 土台を作る PRE-TRAINING 追加学習 人に合わせて躾ける POST-TRAINING 推論 実際に使う INFERENCE

FIG.1 学習(前半2つ)でモデルを「作り」、推論で毎日「使う」

ざっくり言うと、最初の 2 段階=「モデルを作る」工程、最後の推論=「作ったモデルを使う」工程です。作るのは年に数回の大仕事ですが、使うのは毎日・毎秒。だからコストの出どころも段階ごとに大きく違います。順に見ていきましょう。

01事前学習:言葉と世界の知識を覚える

事前学習(Pre-training)は、まっさらなモデルに 「言語の使い方」と「世界の知識」を一気に詰め込む段階です。やっていることは意外と単純で、「次に来る単語を当てる」という穴埋めをひたすら繰り返すだけ。Web ページ・書籍・論文・コードなど、数十兆語ぶんのテキストで延々と予測練習をさせます。

「単語当て」を天文学的な量こなすうちに、モデルの内部には文法・常識・簡単な論理のパターンが自然と蓄積されます。これがあとの全段階の「土台」になります。

  • データ:Web・書籍・論文・コードなど、数十兆トークン規模
  • やること:次トークン予測(巨大な穴埋め問題)
  • 規模:フロンティアモデルで 1 万〜2 万枚以上の GPU を数週間〜数ヶ月連続稼働
  • 費用:2026 年級の最前線モデルで 1 回あたり 2〜5 億ドル規模(電力が GPU 以上のボトルネックになりつつある)
  • 担い手:OpenAI・Anthropic・Google・Meta・Mistral など、ごく一部のプレイヤー

つまり事前学習は 「資金力のある組織がまとめてやる、一番お金のかかる工程」。私たち利用者がこの段階に手を出すことはまずありません。

02追加学習:人に役立つ・安全に振る舞うよう躾ける

事前学習を終えたモデルは、知識はあっても 「ただの高性能な次単語予測機」にすぎません。質問にきちんと答えたり、危険な要求を断ったり、自然に会話したりはまだ苦手です。そこで 追加学習(Post-training)で「人の役に立つ振る舞い」を後から教え込みます。ここで初めて 「ファインチューニング」という言葉が登場します。

続きを読むには無料登録が必要です

アカウントを作成すると、オリジナル記事の全文をお読みいただけます。