#558
summarized by : Yuma Ochi
Spiking Transformers for Event-Based Single Object Tracking

どんな論文か?

イベントカメラのデータから、1つの物体を追跡するタスクに対する、新しいアプローチを提案した。具体的には、SNNに基づく時間的な特徴抽出機構と、従来手法の空間特徴抽出機構を組合せたSTNetと呼ばれるモデルを提案した。本モデルでは、新しく提案された2つの情報(空間、時間)を動的に融合させる機構も使われている。
placeholder

新規性

イベントカメラの物体追跡タスクにおいて、時間と空間の情報の特徴抽出を動的に組合せる手法を提案したこと。世界で初めて時間情報特徴抽出機構に、SNNを用いたこと。

結果

3つのイベントカメラ物体追跡データセットを用いて従来モデルと比較した。多くの評価指標でSoTAを達成し、異なる条件下でもロバストであること、従来モデルよりも2倍以上FPSが高く、有効性が示された。時間情報特徴抽出機構では、LSTMよりもSNNを使うほうが性能が良いことが報告された。

その他(なぜ通ったか?等)

https://github.com/Jee-King/CVPR2022_STNet