#3
summarized by : QIU YUE
HiFT: Hierarchical Feature Transformer for Aerial Tracking

どんな論文か?

上空から撮影される映像から、HumanやCarなどをトラッキングするタスクのためのTransformer構造HiFTを提案.具体的に、マルチレベルのCNN構造により階層的なSimailarity mapsを計算し、Transformer構造により更に各階層間の関係を学習する構造を提案.提案手法により有効的に上空映像からのTrackingを行える.
placeholder

新規性

①Transformer構造をAerial video(上空映像)から人物を追跡するタスクに導入した.②既存のSiameseベースの手法が物体領域が小さい、物体のアピアランスの変化タイプが複雑な場面において性能が低い傾向になる.提案のHiFTが有効的に精度と運行コストのTrade-offを取られていて、追跡するのに性能の良い階層的なTransformerの特徴表現を得た.

結果

Real-Timeレベルの精度を達成しながら、既存の4つのaerial benchmarksにおいて提案のHiFT手法の有効性を示した.

その他(なぜ通ったか?等)