#34
summarized by : Hirokatsu Kataoka
Spatiotemporal CNN for Video Object Segmentation

どんな論文か?

動画セグメンテーションのためのEnd2Endな時系列モデルを提案。ネットワークは空間的セグメンテーションブランチ(Spatial Segmentation Branch)と時間的一貫性を保つブランチ(Temporal Coherence Branch)、ふたつのコンポーネントから構成される。
placeholder

新規性

時系列のブランチはAdversarial Trainingにより動画に対してラベルなしの事前学習を行い、空間的なブランチは見えやモーションの手がかりから事前学習を行う。各データセットに対応するためには、同時にファインチューニングを行う。

結果

DAVIS-2016/2017, YouTube-Objectに対して検証を行なった。OnAVOS/DRLなど従来法と比較してもより精度が高い手法を提供。

その他(なぜ通ったか?等)