#25
summarized by : Masanori YANO
Towards Grand Unification of Object Tracking

どんな論文か?

動画からオブジェクトを追跡する4種類のタスク(SOT, MOT, VOS, MOTS)で、共通のネットワーク構造とパラメータで統一的に対応できる手法。
placeholder

新規性

現在のフレームと隣接するフレームの特徴抽出を行ってから、4種類のタスクで共通のUnified EmbeddingとUnified Headを使用して追跡を行うUnicornを提案した。SOTとMOTのデータセットで学習してから、VOSとMOTSのデータセットの二段階で学習を行う。

結果

バックボーンにConvNeXtを使用し、8種類のデータセットで比較評価を行い、4種類のタスクの従来手法を上回るか同等以上の結果。

その他(なぜ通ったか?等)

複数のタスクを統一するアプローチを示し、追跡性能も高いため通ったと考えられる。PyTorch実装( https://github.com/MasterBin-IIAU/Unicorn )が公開されている。