summarized by : Anonymous
Jingwei Ji, Rishi Desai, Juan Carlos Niebles
Human-Object Relationship Detectionのタスクにおいて,マルチビューの画像に対して物体,物体間の関係性,人物姿勢の時空間的な推論を行う.
静的画像のみを用いた空間方向の補足だけでなく,時間方向の特徴量を捉える.
マルチビューの画像に対して物体,物体間の関係性,人物姿勢の特徴量を抽出することができるIntra and Inter Transformersを提案することで,時空間的な特徴量を学習することに成功した.