AI Navigate

インサイト最新記事一覧 AI大全

Liquid AIのLFM2-24B-A2BがWebGPU経由でWebブラウザ上で動作し、約50トークン/秒で動く

Reddit r/LocalLLaMA / 2026/3/26

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Liquid AIのLFM2-24B-A2B（MoEで総24B・アクティブ2B）をWebブラウザ上でWebGPU経由に動かし、M4 Max環境で約50 tokens/秒の推論速度が報告されています。
同じ環境で8B A1Bバリアントは100 tokens/秒超の速度が出たとされ、ローカル推論の体験に関する手応えが示されています。
デモとしてHugging Face SpacesのWebGPUデモ（LFM2-MoE-WebGPU）と、ONNX最適化モデル（8B/24B）が公開されています。
これにより、ブラウザだけでMoE系LLMの実行を現実的な速度で試せる選択肢が増え、開発者の実装・検証のハードルが下がる可能性があります。

Liquid AIのLFM2-24B-A2BがWebGPU上のブラウザで約50トークン/秒で動作

このモデル（MoE：合計24B、アクティブ2Bパラメータ）は、私のM4 Maxで約50トークン/秒で動作し、8BのA1Bバリアントは同じハードウェアで100トークン/秒を超えます。

デモ（+ ソースコード）：https://huggingface.co/spaces/LiquidAI/LFM2-MoE-WebGPU
最適化済みONNXモデル：
- https://huggingface.co/LiquidAI/LFM2-8B-A1B-ONNX
- https://huggingface.co/LiquidAI/LFM2-24B-A2B-ONNX

投稿者： /u/xenovatech
[リンク] [コメント]

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 3/26Dailyインサイトを見る →

関連記事

竹中工務店がデータセンターの設計支援ツール開発、3Dモデルを瞬時に作成

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

三菱電機も出資、ユニコーン予備軍の燈フィジカルAI「26年内に」

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

CopilotのExcelエージェントを使う、売上集計や分析用ブックを自動生成

日経XTECH

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。