#64
summarized by : Naoya Chiba
An LSTM Approach to Temporal 3D Object Detection in LiDAR Point Clouds

どんな論文か?

LSTMをスパースな点群に対応するよう拡張し,時系列LiDAR点群データからの物体検出・追跡を行う.ボクセルグリッドによるスパースな畳み込み(SparseConv)を用いたU-Net構造のネットワークで入力点群から特徴量を抽出した後,LSTMで時系列データとして過去の物体が検出された点の特徴量と合わせた特徴量を計算,信頼度付きBounding Boxを推定してからグラフ畳み込みで予測を精密化する.
placeholder

新規性

点群シーケンスをLSTMで処理して,フレームを跨いだ物体検出・追跡を行った点が新規.LSTMの処理を軽量にするため,高い信頼度で物体が検出された点のみを記憶,さらに全結合層をスパースな畳み込みで置き換える.3Dの畳み込みはボクセル化して行い,最終的な推定では各点の特徴量に戻してグラフ畳み込みを行う.

結果

Waymo Open Datasetで検証し,既存手法よりも優れたスコアを達成.時系列データとして扱うことでFalse Negativesが少なくなっていることを確認した.LSTMが記憶している点を可視化し,空間的なAttentionのような働きをしていることを確認した.

その他(なぜ通ったか?等)

https://youtu.be/5M2cbMbBJ2U