#76
summarized by : Yuta Tokuoka
FEELVOS: Fast End-To-End Embedding Learning for Video Object Segmentation

どんな論文か?

ビデオオブジェクトセグメンテーション(VOS)は複雑なモデル設計と厳密なfine-tuningにより高精度化が実現されていたが、本研究では単一のNNによるfine-tuningを行わない高速なVOSを試みた。
placeholder

新規性

提案手法は、pixel-wise metrix learningによりframe間の距離をembeddingしてVOSに用いている。

結果

提案手法はSOTAより高速であり、比肩する精度を達成した。

その他(なぜ通ったか?等)

本論文では、VOSを行う上で重要な要素を"Simple", "Fast", "End-to-end", "Strong"であるとしており、これらをすべて満たした手法は初であるとしているロジックが結果と符号している点にインパクトがある。