AI Navigate

アップデートアップデート最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

feat: AesSedai による ggml-org/llama.cpp Pull Request #22493 で Mimo v2.5 モデル対応を追加

Reddit r/LocalLLaMA / 2026/5/7

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

原文を読む →

共有:

要点

AesSedai が ggml-org/llama.cpp に XiaomiMiMo の MiMo v2.5 モデル対応を追加するプルリクエストを提出しました。
MiMo v2.5 はスパース Mixture of Experts（MoE）アーキテクチャで、総パラメータは310B、活性化は15Bです。
最大100万トークンの非常に長いコンテキスト長に対応し、テキスト・画像・動画・音声のマルチモーダルを扱えます。
729Mパラメータの ViT ビジョンエンコーダ、261Mパラメータの音声トランスフォーマーエンコーダ、さらに Multi-Token Prediction（MTP）部（329Mパラメータ）を備えています。
今回の更新により、llama.cpp で MiMo v2.5 系のローカルなマルチモーダル推論を行える幅が広がります。

feat: Add Mimo v2.5 model support by AesSedai · Pull Request #22493 · ggml-org/llama.cpp

https://huggingface.co/XiaomiMiMo/MiMo-V2.5

モデル概要

アーキテクチャ: スパースMoE（Mixture of Experts）、総計310B / 有効15Bパラメータ
コンテキスト長: 最大1Mトークン
モダリティ: テキスト、画像、動画、音声
ビジョン・エンコーダ: 729MパラメータのViT（28層: 24 SWA + 4 Full）
オーディオ・エンコーダ: 261MパラメータのAudio Transformer（24層: 12 SWA + 12 Full）
マルチトークン予測（MTP）: 329Mパラメータ、3層

提出者 /u/jacek2023
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

VLA内製へ、ローム買収に意欲

VLA内製へ、ローム買収に意欲

日経XTECH

サービス連携でライバルに一歩リードの「Gemini」、性能もChatGPTに迫る

サービス連携でライバルに一歩リードの「Gemini」、性能もChatGPTに迫る

日経XTECH

「MCP Sentinel v1.0」公開：MCPツールスキーマのロックファイル

「MCP Sentinel v1.0」公開：MCPツールスキーマのロックファイル

Dev.to

ニューラル・アート・スタイル変換における色の保持

ニューラル・アート・スタイル変換における色の保持

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告

feat: AesSedai による ggml-org/llama.cpp Pull Request #22493 で Mimo v2.5 モデル対応を追加 | AI Navigate