Hugging Face Spacesの無料枠に小型LLMをあげてAPI を立てる方法(非推奨)
Zenn / 2026/3/29
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage
要点
- Hugging Face Spacesの無料枠で小型LLMをGGUFでなく別形式にすることでAPI構築自体は可能だが、実運用には速度が致命的に遅い。
- 「無料枠でAPIを叩きまくる」動機で検証した結果、無料枠で動作確認はできたものの“使えるレベル”の性能には到達しなかった。
- 事前にbuild通らない問題を2日ほど試行錯誤した末の結論として、GGUFをやめれば動くが、生成速度(例: 1秒に1token)がボトルネックになる。
- 著者はGGUFを別の形で扱う知見や高速化の手段は見つけられず、非推奨の試みとして記録している。
Hugging Face Spacesのbuild通らなすぎて、これ解決にまる2日くらい費やしたので、解決方法を残します。結論は、GGUFやめたら 「できるけど、おもい」 です。
動機:「超小型LLMをhugging face spacesの無料枠にあげてたら、無料枠でAPI叩きまくれて最強じゃん」という感情。
結果:なんと上がりました。しかしGGUFやめたので1秒に1tokenとかって速度なんで、使えるレベルではないです。マジで動くだけ。GGUFでなんとかする知見はありません。
無料枠でAPI作ろうという倫理観の無さは、筆者が「バイブコーディングで稼ごう界隈」なんでお察しください。
あ...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



