#333
summarized by : Masanori YANO
MeMOT: Multi-Object Tracking With Memory

どんな論文か?

複数オブジェクトのトラッキング(MOT)で、Transformerにメモリーネットワークを取り入れた手法。
placeholder

新規性

フレーム画像をCNNで特徴抽出してからTransformerのEncoderとDecoderでオブジェクト情報の仮説を生成し、メモリーから取り出した長期記憶と短期記憶をアテンション機構に通し、仮説と合体させてクエリとして扱い、物体検出とトラッキングのデータ対応付けを同時に推定するMeMOTを提案した。

結果

COCOデータセットで事前学習済みのResNet-50とDeformable DETRをバックボーンに使用し、MOT16とMOT17とMOT20で比較評価を行い、従来手法を上回る結果。同じくTransformerベースのMOTRと比較すると、MeMOTは誤検出のFPやIDスイッチが多いものの、検出漏れのFNが少なく、かつMeMOTの方が評価指標で見たときに上回っている。

その他(なぜ通ったか?等)

現時点で実装は公開されていないが、MOTで新たなメモリーネットワークの枠組みを提案し、追跡性能も高いため通ったと考えられる。