#361
summarized by : 近藤 佑樹(Kondo, Yuki)
TrackFormer: Multi-Object Tracking With Transformers

どんな論文か?

既存手法では物体検出後のデータを,グラフや運動モデルや社会モデルなど緻密なアルゴリズム設計によって同一推定を行い,Multi-Object Tracking(MOT)を行っていた.本論文では物体検出とデータの関連付けを同時に行う新たなTracking-by-attention法となるTrackFormerを提案し,グラフの最適化や動き・見た目のモデリングの省略とSoTAを達成.
placeholder

新規性

検出後のデータにAttentionを用いる手法と異なり,提案手法では物体検出とデータの関連付けをEnd-to-endに同時推定するアプローチを提案.自己回帰させるトラッククエリには,物体のクラスやサイズ,位置そしてそれらの同一性の情報が埋め込まれる.加えて提案モデルの特性とデータ特性を考慮した学習戦略を提案.

結果

マルチオブジェクト・トラッキングデータセットであるバウンディングボックスでアノテーションされたMOT17およびセグメンテーションでアノテーションされたMOTS20で有効性を検証.双方のデータセットでSoTAを達成.

その他(なぜ通ったか?等)

従来分離させていた各処理をすべてTransformerで行うことで,各処理でのデータの相互効果を抽出することに成功.著者らと同じFAIRから提案されたDETRの「集合予測問題として一気に解く」というモチベーションが本論文でもあり,それをTransformerで実現させ,有効性を示したことに大きな価値がある. https://github.com/timmeinhardt/trackformer