#422
summarized by : Masaki Taniguchi
MS-TCN: Multi-Stage Temporal Convolutional Network for Action Segmentation

どんな論文か?

本論文ではTemporal Action Segmentation(長時間映像中の各フレーム内における行動を予測するタスク)を扱うモデルと損失関数を提案し、3つのベンチマークでSOTAを記録した。モデルとしては各ステージにTCNを用いたマルチステージの分類器を、損失関数としては交差エントロピーとしきい値付きの連続フレーム間KL情報量との加重和を提案した。
placeholder

新規性

既存手法でよく使われるtemporal poolingではなくdelated convoluitionを用いた。 また、提案した損失関数は交差エントロピーだけを用いるよりもover-segmentation(ここでは過剰に細かい時間間隔で予測してしまうこと)を抑制できる。

結果

3つのベンチマークにおいて既存手法よりも大きくスコアを更新し、SOTAを達成している。

その他(なぜ通ったか?等)