- …
- …
#396
summarized by : Shintaro Yamamoto
どんな論文か?
人間と物体の関係を記述するHuman Object Interaction(HOI)は,物体検出と関係の推定の2段階に分かれていた.これに対して,HOIをend-to-endでやるTransformerベースの手法を提案.
新規性
Encoder-decoder構造のTransformerを導入.Decoderから得られたembeddingを入力とし,関係性及びbounding boxを予測するMLPを構築.
結果
HICO-DETで26.61% AP,V-COCOで52.9 AProleを達成した.
その他(なぜ通ったか?等)
https://github.com/bbepoch/HoiTransformer
- …
- …