重要なときだけ色を:常時オン・ストリーミング映像センシングのためのグレイスケール誘導型オンライン・トリガ

arXiv cs.CV / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、エッジ端末やウェアラブル端末における常時オンのストリーミング映像センシングのコストを削減するために、「常時グレースケール、必要時にカラー」というパラダイムを提案する。
  • 连続的なグレースケールのストリームは時間構造を十分に保持できるため、ほぼベースラインに近いストリーミング映像理解性能を得るには、疎なRGBフレームだけで足りると主張する。
  • 手法であるColorTriggerは、ウィンドウ化したグレースケールの親和性解析を用いて、RGB撮像を選択的にオンにするオンラインかつ学習不要のトリガである。
  • ColorTriggerは軽量な二次計画法により色の冗長性を因果的に検出し、クレジット予算に基づく制御と動的トークンルーティングによって、センシングと推論のトレードオフを管理する。
  • ストリーミング映像理解のベンチマークにおいて、フルカラーのベースラインの91.6%に到達しながらRGBフレームをわずか8.1%しか用いず、自然映像における大きな色の冗長性が示唆される。
広告