Moonshot AI、可変長バッチングとH20ベンチマーク付き「FlashKDA」をオープンソース化—Kimi Delta Attention向けCUTLASSカーネル

MarkTechPost / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • Moonshot AIは、Kimi Delta Attentionの高性能実装であるFlashKDAをオープンソースとして公開しました。
  • FlashKDAは、flash-linear-attentionエコシステムに直接組み込めることを目的に設計されています。
  • ベンチマークでは、FlashKDAが従来手法よりも「意味のある」高速化を示したと報告されています。
  • リリースでは可変長バッチングの対応と、H20の性能ベンチマークの提示に重点が置かれています。

Moonshot AIは、flash-linear-attentionエコシステムに直接接続する高性能なKimi Delta Attentionの実装であるFlashKDAをリリースしており、ベンチマークではそれが明確に高速であることが示されています。

この投稿 Moonshot AI Open-Sources FlashKDA: 可変長バッチ処理とH20ベンチマークを備えたKimi Delta Attention向けのCUTLASSカーネル は、MarkTechPost に最初に掲載されました。