Visual-Textual Capsule Routing for Text-Based Video Segmentation

#337

summarized by : 日坂　幸次

Bruce McIntosh, Kevin Duarte, Yogesh S Rawat, Mubarak Shah

Queryのテキストとビデオを入力して、Queryに相当する部分をビデオから抜き出す方法

今までは1フレーム内での検知だったが、今回のは全フレームでの検知。

本研究では、ビジュアル・テキスト・カプセルルーティングの有効性を実証するとともに、最新のアプローチと比較して性能が向上していることを確認した

このページで利用されている画像は論文から引用しています．