| Reka Edgeは、画像/動画+テキスト入力を受け取り、テキスト出力を生成する非常に効率的な70億パラメータのマルチモーダル視覚言語モデルです。このモデルは、画像理解、動画解析、物体検出、エージェント的ツール利用において業界最先端の性能を発揮するよう特化して最適化されています。 https://reka.ai/news/reka-edge-frontier-level-edge-intelligence-for-physical-ai [link] [comments] |
RekaAI/reka-edge-2603 · Hugging Face
Reddit r/LocalLLaMA / 2026/3/11
📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research
要点
- Reka Edgeは、画像、動画、テキストの入力を受け取りテキスト出力を生成する、高効率な70億パラメータのマルチモーダル視覚言語モデルです。
- このモデルは、画像理解、動画解析、物体検出、エージェントによるツール使用などの主要なコンピュータビジョンタスクで最高水準の性能を発揮するよう設計されています。
- エッジインテリジェンスに最適化されており、物理的またはエッジデバイスレベルで高度なAI機能を実現することで産業用途をターゲットとしています。
- モデルは研究および実用利用のためにHugging Faceで公開されており、コミュニティの関与と開発を支援します。
- Reka Edgeの能力と応用に関する追加情報や背景は、Reka AIによるリンク先の発表から入手可能です。