SpikeCLR: スパイキングニューラルネットワークを用いた少数ショットのイベントベース視覚におけるコントラスト型自己教師付き学習

arXiv cs.CV / 2026/3/18

📰 ニュースModels & Research

共有:

要点

SpikeCLR は、ラベルなしのイベントデータから頑健な視覚表現を学習させることを可能にする、スパイキングニューラルネットワーク用の対照的自己教師付き学習フレームワークである。
このアプローチは、フレームベースの対照的手法をスパイキング領域に適用するため、代理勾配訓練を用い、空間・時間・極性情報を活用するイベント特有のデータ拡張を導入する。
CIFAR10-DVS、N-Caltech101、N-MNIST、DVS-Gesture の実験は、自己教師付き事前学習とファインチューニングが、データが少ない領域で教師あり学習を上回り、少数ショットおよび半教師あり設定で性能が向上したことを示した。
アブレーションの結果、空間的および時間的な拡張を組み合わせることが、イベントデータにおける効果的な時空間不変性を学習するうえで不可欠であることが示された。
SpikeCLR によって学習された表現はデータセット間で転移可能であり、ニューロモルフィックハードウェア上でエネルギー効率の高い、ラベルが乏しいイベントベースのモデルを支える。

要約: イベント駆動型ビジョンセンサは、高速知覚に対して顕著な利点を提供します。マイクロ秒単位の時間分解能、高いダイナミックレンジ、低消費電力を含みます。スパイキングニューラルネットワーク（SNN）と組み合わせると、ネウロモルフィックハードウェア上で展開でき、組込みシステムでのエネルギー効率に優れたアプリケーションを可能にします。しかし、この可能性は、これらのモデルを効果的に訓練するために必要な大規模なラベル付きデータセットの不足によって深刻に制限されます。
本研究では、SpikeCLRを導入します。対照学習を用いた自己教師あり学習フレームワークで、SNNがラベルなしのイベントデータから頑健な視覚表現を学習できるようにします。私たちは、従来のフレームベース手法をスパイキング領域に適用するため、代理勾配訓練を用い、空間的・時間的・極性変換を活用するイベント特有の拡張手法の一連を導入します。CIFAR10-DVS、N-Caltech101、N-MNIST、DVS-Gestureのベンチマークにおける大規模な実験を通じて、自己教師ありの事前学習とその後のファインチューニングが、データが少ない領域で監督付き学習を上回ることを示し、少数ショット学習および半教師あり設定で一貫した改善を達成します。アブレーション研究から、空間的拡張と時間的拡張を組み合わせることが、イベントデータにおいて効果的な時空不変性を学習するうえで重要であることが示されました。さらに、学習された表現がデータセット間で転移可能であることを示し、ラベル欠如の環境における強力なイベントベースモデルの構築に寄与します。

Sakana Chatが登場しました

note

AIでも解けなかった「あるなしクイズ」｜人間の直感が勝つ瞬間。AIより、おかんの方が賢かった

note

Gemini 同時通訳の革新：リアルタイム翻訳の圧倒的進化と実務活用ガイド

note

なぜ松尾豊は『AIの第一人者』なのか——Google Scholarと生成AIが作る権威の正体

note

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

SpikeCLR: スパイキングニューラルネットワークを用いた少数ショットのイベントベース視覚におけるコントラスト型自己教師付き学習

要点

関連記事

Sakana Chatが登場しました

AIでも解けなかった「あるなしクイズ」｜人間の直感が勝つ瞬間。AIより、おかんの方が賢かった

Gemini 同時通訳の革新：リアルタイム翻訳の圧倒的進化と実務活用ガイド

なぜ松尾豊は『AIの第一人者』なのか——Google Scholarと生成AIが作る権威の正体

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Sakana Chatが登場しました

AIでも解けなかった「あるなしクイズ」｜人間の直感が勝つ瞬間。AIより、おかんの方が賢かった

Gemini 同時 通訳の革新：リアルタイム翻訳の圧倒的進化と実務活用ガイド

なぜ松尾豊は『AIの第一人者』なのか——Google Scholarと生成AIが作る権威の正体

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

Gemini 同時通訳の革新：リアルタイム翻訳の圧倒的進化と実務活用ガイド