広告

Hugging Face Spacesの無料枠に小型LLMをあげてAPI を立てる方法(非推奨)

Zenn / 2026/3/29

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • Hugging Face Spacesの無料枠で小型LLMをGGUFでなく別形式にすることでAPI構築自体は可能だが、実運用には速度が致命的に遅い。
  • 「無料枠でAPIを叩きまくる」動機で検証した結果、無料枠で動作確認はできたものの“使えるレベル”の性能には到達しなかった。
  • 事前にbuild通らない問題を2日ほど試行錯誤した末の結論として、GGUFをやめれば動くが、生成速度(例: 1秒に1token)がボトルネックになる。
  • 著者はGGUFを別の形で扱う知見や高速化の手段は見つけられず、非推奨の試みとして記録している。
Hugging Face Spacesのbuild通らなすぎて、これ解決にまる2日くらい費やしたので、解決方法を残します。結論は、GGUFやめたら 「できるけど、おもい」 です。 動機:「超小型LLMをhugging face spacesの無料枠にあげてたら、無料枠でAPI叩きまくれて最強じゃん」という感情。 結果:なんと上がりました。しかしGGUFやめたので1秒に1tokenとかって速度なんで、使えるレベルではないです。マジで動くだけ。GGUFでなんとかする知見はありません。 無料枠でAPI作ろうという倫理観の無さは、筆者が「バイブコーディングで稼ごう界隈」なんでお察しください。 あ...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →

広告