Transformer Tracking

#637

summarized by : 金城忍

Xin Chen, Bin Yan, Jiawen Zhu, Dong Wang, Xiaoyun Yang, Huchuan Lu

どんな論文か？

テンプレート及び探索範囲を示す画像のそれぞれの特徴量からそれぞれの特徴量ベクトル毎で、要素毎の大域的な関連度で重み付けし各要素を更新し、更新された特徴量ベクトルを利用して、特徴量間の関連度を取り出し、テンプレートの画像に基づいた検索範囲内の物体を追跡する提案

新規性

3つのTransformer (特にCross attention) を利用しテンプレート及び探索範囲となる画像の特徴量を、互いの直接的な相関関係考慮せず融合するという点で新規

結果

前段の特徴量抽出器をImageNetで事前学習済みのResNet-50を利用し、LaSOT、TrackingNet及びGOT-10kでの評価において、提案手法は既存手法より良い結果となる一方で、提案手法において物体追跡の結果に利用される前処理無しでの結果では、前処理有りの結果とほぼ同等の結果が得られた

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．