TubeTK: Adopting Tubes to Track Multi-Object in a One-Step Training Model

#404

summarized by : pacifinapacific

Bo Pang, Yizhuo Li, Yifan Zhang, Muchen Li, Cewu Lu

MOTタスク(online)において従来のbboxベースではなく,時間方向にも拡大したBounding Tube(BTube)を導入することでend to endなトラッキングを可能にした

トラッキングはフレームごとのbbox検出を関連づける手法が主流だが,本論文では検出を3DCNNを利用したBTubeで表現している。これによりspartialだけでなくtemporalな関連づけもend to endに抽出できる

MOT17データセットでpublic detectorを使用せずにSOTAを達成した

3DCNNは動画認識において高い性能を示しておりそれをトラッキングにも利用し高い性能を示した点

このページで利用されている画像は論文から引用しています．