#337
summarized by : 日坂 幸次
Visual-Textual Capsule Routing for Text-Based Video Segmentation

どんな論文か?

Queryのテキストとビデオを入力して、Queryに相当する部分をビデオから抜き出す方法
placeholder

新規性

今までは1フレーム内での検知だったが、今回のは全フレームでの検知。

結果

本研究では、ビジュアル・テキスト・カプセルルーティングの有効性を実証するとともに、最新のアプローチと比較して性能が向上していることを確認した

その他(なぜ通ったか?等)