Spatiotemporal CNN for Video Object Segmentation

#34

summarized by : Hirokatsu Kataoka

Kai Xu, Longyin Wen, Guorong Li, Liefeng Bo, Qingming Huang

動画セグメンテーションのためのEnd2Endな時系列モデルを提案。ネットワークは空間的セグメンテーションブランチ（Spatial Segmentation Branch）と時間的一貫性を保つブランチ（Temporal Coherence Branch）、ふたつのコンポーネントから構成される。

時系列のブランチはAdversarial Trainingにより動画に対してラベルなしの事前学習を行い、空間的なブランチは見えやモーションの手がかりから事前学習を行う。各データセットに対応するためには、同時にファインチューニングを行う。

DAVIS-2016/2017, YouTube-Objectに対して検証を行なった。OnAVOS/DRLなど従来法と比較してもより精度が高い手法を提供。

このページで利用されている画像は論文から引用しています．