マイコン向けのWebSerialビジョントレーニング:オンデバイスCNN学習のためのブラウザベース・コンパニオン

arXiv cs.CV / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 本論文では、ChromiumベースのブラウザのみでSeeed Studio XIAO ESP32-S3 Sense上のTinyMLビジョンモデルを学習・デプロイできる、単一ファイルのゼロインストールWebアプリ「webmcu-vision-web」を提案しています。
  • これはオンデバイスArduinoファームウェアのローカル・コンパニオンとして機能し、ファームウェアの書き込みから画像収集、CNN学習、重みの書き出し、推論中の活性の可視化までを、データを外部に送らずに一連で扱えるとされています。
  • ブラウザ内でのファーム書き込み(esptool-js)、SDカード上の画像閲覧とプレビュー、インライン編集、さらにconfig.jsonによるハイパーパラメータのライブ同期(再コンパイル不要)にも対応しています。
  • TensorFlow.jsを用いた3クラス学習では、クラスあたり約30枚・20エポックでブラウザ側が約1分、オンデバイス側が約9分と報告され、収集〜学習〜デプロイの一連を10分未満で完了できるとしています。
  • 参照となる3クラス問題で5回の一貫性評価を行い安定した収束を示したうえで、成果物とMITライセンスのソースコードを公開しており、新しいハードやタスクへの適応のための「生きたテンプレート」だと述べています。