#98
summarized by : Akihiro FUJII
An End-to-End Transformer Model for 3D Object Detection

どんな論文か?

E2Eで学習できる3D物体検知手法3DETRを提案。DETRのようにset-to-set問題として点群の物体検知を扱っているが、DETRと異なりTransformerのみを使っており、人手で調整するべきパラメーターを排除している。
placeholder

新規性

Transformerのみを使ったモデルを使っており、人手で調整するようなパラメーターを排除しているところが新規点。フーリエ変換を用いた位置情報付与で、点群特有の機構と同程度の性能を持たせられるとのこと

結果

先行研究であるVoteNetをScanNetV2で9.5%上回る結果。

その他(なぜ通ったか?等)

https://facebookresearch.github.io/3detr/