#355
summarized by : Masanori YANO
DESTR: Object Detection With Split Transformer

どんな論文か?

Transformerを使用した物体検出で、DETRのCross-Attentionレイヤーと訓練初期の物体クエリが弱い部分を改良した手法。
placeholder

新規性

Cross-Attentionレイヤーを物体のクラス分類(cls)とバウンディングボックスの回帰(reg)で分岐させて個別に推定し、また物体クエリを強化するためFCOSをベースとした「ミニ検出器」を内部に組み込みTransformerのDecoderに入力させるDESTRを提案した。

結果

バックボーンにResNet-50とResNet-101を使用し、COCOデータセットで評価を行い、オリジナルのDETRやICCV 2021採択のConditional DETRを上回る結果。

その他(なぜ通ったか?等)

DETRの課題を整理した上で新たなネットワーク構造を提案し、検出性能の向上を示したため通ったと考えられる。