EdgeFM：視覚言語モデル向けの効率的なエッジ推論

arXiv cs.CV / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

EdgeFMは、産業用エッジでの決定論的な低遅延と、厳しいリソース制約下でも安定した性能を満たすことを目的とした、軽量なVLM（視覚言語）/VLA（視覚言語アクション）推論フレームワークです。
エージェント駆動で設定を探索・チューニングし、標準的なLLMオペレーター向けに高最適化された低レベルカーネルを生成することで、その最適化を再利用可能なモジュール式「スキル」として提供します。
大規模で汎用的な設計を避け、ブラックボックスで閉鎖的なベンダーツールチェーンへの依存を低減することで、クロスプラットフォーム適応力の向上とハードウェア・ロックインの抑制を狙っています。
x86やNVIDIA Orin SoCなどの主流プラットフォームに対応し、Horizon JourneyプラットフォームでのエンドツーエンドVLAデプロイとして初めての事例だと報告されています。
実験では、NVIDIA Orin上でTensorRT-Edge-LLMに対して最大1.49倍の高速化が示され、多様な産業用エッジシナリオで良好なエンドツーエンド推論性能を提供します。

日経XTECH

Dev.to

ITmedia AI+

Reddit r/artificial

Dev.to