EdgeFM:視覚言語モデル向けの効率的なエッジ推論

arXiv cs.CV / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • EdgeFMは、産業用エッジでの決定論的な低遅延と、厳しいリソース制約下でも安定した性能を満たすことを目的とした、軽量なVLM(視覚言語)/VLA(視覚言語アクション)推論フレームワークです。
  • エージェント駆動で設定を探索・チューニングし、標準的なLLMオペレーター向けに高最適化された低レベルカーネルを生成することで、その最適化を再利用可能なモジュール式「スキル」として提供します。
  • 大規模で汎用的な設計を避け、ブラックボックスで閉鎖的なベンダーツールチェーンへの依存を低減することで、クロスプラットフォーム適応力の向上とハードウェア・ロックインの抑制を狙っています。
  • x86やNVIDIA Orin SoCなどの主流プラットフォームに対応し、Horizon JourneyプラットフォームでのエンドツーエンドVLAデプロイとして初めての事例だと報告されています。
  • 実験では、NVIDIA Orin上でTensorRT-Edge-LLMに対して最大1.49倍の高速化が示され、多様な産業用エッジシナリオで良好なエンドツーエンド推論性能を提供します。