summarized by : Akihiro FUJII
Pei Sun; Mingxing Tan; Weiyue Wang; Chenxi Liu; Fei Xia; Zhaoqi Leng; Dragomir Anguelov
疎なデータである3次元点群のためのトランスフォーマー SWFormer を提案。各スケールの特徴量の統合、疑似的な可変長のバケット探知に分けての処理、Swin Transformer のような窓内での注意機構を用いている。SWFormerはWaymo Open Datasetで最先端の性能を獲得。
Swin Transformer をベースに点群の疎なデータ構造にあったトランスフォーマーを提案したこと。疎な部分はマスク処理をほどこしている。
Waymo Open Datasetの3Dオブジェクト検出タスクで最先端の性能を獲得