summarized by : Komiki Maruyama
Mengmeng Xu, Chen Zhao, David S. Rojas, Ali Thabet, Bernard Ghanem
動画中のアクションの時間的な位置を検出するという研究.ビデオをグラフとして表現するグラフ畳み込みネットワークベースの手法を提案.
ビデオのスニペットをノード,スニペット間の相関をエッジとしたグラフによってビデオを表現することで,アクションのローカライズをサブグラフのローカライズの問題として解くというのが新しい.
THUMOS-14,ActivityNet-1.3のデータセットでSoTAを達成.
ビデオの意味的な繋がりを表現したグラフが可視化されておりおもしろい.