#431
summarized by : Jun Kimata
TransRAC: Encoding Multi-Scale Temporal Correlation With Transformers for Repetitive Action Counting

どんな論文か?

動画中の繰り返し動作をカウントするタスクについて検討している. 既存のデータセットの動画が短いことを問題視し,より長い時間の動画で構成されたデータセットRepCountを提案した.このデータセットでは,より精密なアノテーションや,動作の中断の考慮などもされている. 更に,長い時間の動画での動作カウントに対応するための図のようなモデル,TransRACも提案した.
placeholder

新規性

従来のタスクにおける問題点を考慮したデータセットであるRepCountの提案. 更に,そのデータセットに適したモデルであるTransRACの提案

結果

提案したデータセットにおいて提案モデルは良い性能を示した. また,他のデータセットにおいても良い性能を示し,ファインチューニングを行わない未公開データセットでも同様に良い性能を示した.

その他(なぜ通ったか?等)

データセットのURL https://svip- lab.github.io/dataset/RepCount_dataset.html