- …
- …
#297
summarized by : Masanori YANO
どんな論文か?
物体検出で、デコーダを使用せず全てTransformerベースで実現した手法。DETR以降に使用されているTransformerデコーダが性能低下の要因と指摘し、アンカーベースの改善策を提示している。
新規性
マルチスケールの特徴抽出を目的としたDOTバックボーンと、マルチスケールの特徴マップを一つに集約するSAEブロックと、グループかつチャネル単位のアテンション機構で物体検出を行うTAEで構成されるDFFTを提案した。
結果
COCOデータセットで評価を行い、従来手法を上回る結果。DETR以降のTransformerベースの従来手法と比較して、訓練時の収束も早い結果。
その他(なぜ通ったか?等)
新たなネットワーク構造を提案し、検出性能も高いため通ったと考えられる。MMDetectionベースの実装( https://github.com/PeixianChen/DFFT )が公開されている。
- …
- …