- …
- …
#333
summarized by : Masanori YANO
新規性
フレーム画像をCNNで特徴抽出してからTransformerのEncoderとDecoderでオブジェクト情報の仮説を生成し、メモリーから取り出した長期記憶と短期記憶をアテンション機構に通し、仮説と合体させてクエリとして扱い、物体検出とトラッキングのデータ対応付けを同時に推定するMeMOTを提案した。
結果
COCOデータセットで事前学習済みのResNet-50とDeformable DETRをバックボーンに使用し、MOT16とMOT17とMOT20で比較評価を行い、従来手法を上回る結果。同じくTransformerベースのMOTRと比較すると、MeMOTは誤検出のFPやIDスイッチが多いものの、検出漏れのFNが少なく、かつMeMOTの方が評価指標で見たときに上回っている。
その他(なぜ通ったか?等)
現時点で実装は公開されていないが、MOTで新たなメモリーネットワークの枠組みを提案し、追跡性能も高いため通ったと考えられる。
- …
- …