#404
summarized by : pacifinapacific
TubeTK: Adopting Tubes to Track Multi-Object in a One-Step Training Model

どんな論文か?

MOTタスク(online)において従来のbboxベースではなく,時間方向にも拡大したBounding Tube(BTube)を導入することでend to endなトラッキングを可能にした
placeholder

新規性

トラッキングはフレームごとのbbox検出を関連づける手法が主流だが,本論文では検出を3DCNNを利用したBTubeで表現している。これによりspartialだけでなくtemporalな関連づけもend to endに抽出できる

結果

MOT17データセットでpublic detectorを使用せずにSOTAを達成した

その他(なぜ通ったか?等)

3DCNNは動画認識において高い性能を示しておりそれをトラッキングにも利用し高い性能を示した点