スクラッチから初めてモデルを作った話

Reddit r/LocalLLaMA / 2026/5/3

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 著者のCrowneliusは、彼が構築した「Shard」(40MパラメータのLLM)を紹介し、Hugging Faceのリンク経由で公開しています。
  • IoT向けのタスクで首尾一貫した動作を行えるように、小型の「tiny LLM」を作る取り組みについて述べています。
  • 「atomic models」を調べたことや、Compact AIというプロジェクトに参加して学んだことが触れられています。
  • スクラッチから作ったモデルは「Shard」(「Scamp」とも呼称)で、一般公開されていると説明しています。

やあ、Crowneliusだよ。あの人気の傑作となった蒸留データセットを作った。

今日は、4,000万パラメータの不正形式のLLMである「SHARD」を紹介する。

今、僕は小さなLLMのシリーズを作っているところで、IoTのタスクのために筋の通ったモデルを動かすことを目標にしている。原子モデルを調べていたら、「Compact AI」と呼ばれるプロジェクトに出会った。それに参加してからというもの、たくさんのことを学び、さらには自分で最初からモデルを作り上げた。

そのモデルはこちらで利用可能:CompactAI-O[HF Organization]

僕のモデル名は「Shard」——「Scamp」と呼んでいる。

投稿者: /u/volious-ka
[リンク] [コメント]