#85
summarized by : Haruhi Shida
CenterFormer: Center-based Transformer for 3D Object Detection

どんな論文か?

3D物体検出のための新しいCenter based Transformerを提案.現状のネットワークアーキテクチャには,文脈的でグローバルな情報学習が欠けており,局所特徴学習には根本的な問題があることを指摘.本論文では,問題の解決として計算量を大幅に増やすこと無く,隣接する特徴を効率的に集約するためにマルチスケールクロスアテンションレイヤーを用い,Waymo val,testでSoTAを達成した.

新規性

これまでの3D物体検出手法の研究では,クエリベースのtransformerに検出器の改善の可能性があるにも関わらず「点群データの圧倒的なサイズ」が原因で考慮していなかった.本研究ではクロスアテンションによる特徴の融合と,ヒートマップを元にした中心候補をクエリに用いることで変換器構造の収束困難性と計算複雑性を低減した.

結果

Waymo Open Datasetにおいて,val 75.6%mAPH,test 75.6% mAPHと単一モデルにおけるSoTAを達成.また提案されたアーキテクチャ設計は,「decoderの初期クエリ埋め込みとして点群の中心特徴を用いることで収束を高速化可能」「各クエリのクロスアテンション学習を変形可能な領域に集中させることで高い計算量を回避可能」などの有望な結果を示した.

その他(なぜ通ったか?等)