#297
summarized by : Masanori YANO
Efficient Decoder-Free Object Detection with Transformers

どんな論文か?

物体検出で、デコーダを使用せず全てTransformerベースで実現した手法。DETR以降に使用されているTransformerデコーダが性能低下の要因と指摘し、アンカーベースの改善策を提示している。
placeholder

新規性

マルチスケールの特徴抽出を目的としたDOTバックボーンと、マルチスケールの特徴マップを一つに集約するSAEブロックと、グループかつチャネル単位のアテンション機構で物体検出を行うTAEで構成されるDFFTを提案した。

結果

COCOデータセットで評価を行い、従来手法を上回る結果。DETR以降のTransformerベースの従来手法と比較して、訓練時の収束も早い結果。

その他(なぜ通ったか?等)

新たなネットワーク構造を提案し、検出性能も高いため通ったと考えられる。MMDetectionベースの実装( https://github.com/PeixianChen/DFFT )が公開されている。