Hugging Face Spacesの無料枠に小型LLMをあげてAPI を立てる方法(非推奨)
Zenn / 3/29/2026
💬 OpinionDeveloper Stack & InfrastructureTools & Practical Usage
Key Points
- Hugging Face Spacesの無料枠で小型LLMをGGUFでなく別形式にすることでAPI構築自体は可能だが、実運用には速度が致命的に遅い。
- 「無料枠でAPIを叩きまくる」動機で検証した結果、無料枠で動作確認はできたものの“使えるレベル”の性能には到達しなかった。
- 事前にbuild通らない問題を2日ほど試行錯誤した末の結論として、GGUFをやめれば動くが、生成速度(例: 1秒に1token)がボトルネックになる。
- 著者はGGUFを別の形で扱う知見や高速化の手段は見つけられず、非推奨の試みとして記録している。
Hugging Face Spacesのbuild通らなすぎて、これ解決にまる2日くらい費やしたので、解決方法を残します。結論は、GGUFやめたら 「できるけど、おもい」 です。
動機:「超小型LLMをhugging face spacesの無料枠にあげてたら、無料枠でAPI叩きまくれて最強じゃん」という感情。
結果:なんと上がりました。しかしGGUFやめたので1秒に1tokenとかって速度なんで、使えるレベルではないです。マジで動くだけ。GGUFでなんとかする知見はありません。
無料枠でAPI作ろうという倫理観の無さは、筆者が「バイブコーディングで稼ごう界隈」なんでお察しください。
あ...
Continue reading this article on the original site.
Read original →Related Articles

Black Hat Asia
AI Business

AutoGen vs CrewAI: A Comprehensive Benchmark and Selection Guide for 2026
Dev.to

64 Deepfake Laws Passed — And Investigators Still Can't Prove What's Real in Court
Dev.to

Building with TIAMAT: Live API Demos
Dev.to
![[P] I trained an AI to play Resident Evil 4 Remake using Behavioral Cloning + LSTM](/_next/image?url=https%3A%2F%2Fexternal-preview.redd.it%2FzgmJOxETuqgqlsgMxeBl7S4gZNDHf_K3U9w883ioT4M.jpeg%3Fwidth%3D320%26crop%3Dsmart%26auto%3Dwebp%26s%3Da63f97b9d03c40b846cd3eaac472e78050020a43&w=3840&q=75)
[P] I trained an AI to play Resident Evil 4 Remake using Behavioral Cloning + LSTM
Reddit r/MachineLearning