Raspberry Pi YOLO検出器とSlack-Ollama自然言語インターフェースに基づくマルチエージェント物体検出フレームワーク
arXiv cs.CV / 2026/4/16
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、リソース制約のあるRaspberry Piプラットフォーム上で、YOLOベースの視覚エージェントを用いて実装する、エッジベースのマルチエージェント物体検出・追跡フレームワークを提案する。
- システムの制御および通信は、ローカルで動作するSlackチャンネルのチャットボットエージェントと、ローカル実行のOllama LLMレポーティングエージェントを組み合わせることで担い、自然言語での対話を可能にする。
- エージェントの協調は、他のLLMエージェントフレームワークで用いられる完全自律型のオーケストレーション・パターンに代わるものとして位置付けられた、独自のイベント駆動型メッセージ交換サブシステムによって実現される。
- 著者らは、生成AIによって可能になる高速プロトタイピングの開発アプローチを強調しており、この原則を同一のハードウェア上での設計と実装の両方に適用している。
- 実験では、中央集権型のマルチエージェントAIシステムに対する低コストのエッジ検証基盤が持つ実用上の限界を分析し、クラウド資源を必要とする設計と本アプローチを比較する。




