#983
summarized by : Naoya Chiba
Joint Spatial-Temporal Optimization for Stereo 3D Object Tracking

どんな論文か?

三次元物体認識・追跡手法の提案.連続フレームを用いたステレオ画像から2DのBounding Boxを推定し,IoUが大きい対応するBounding Box同士をで対応させてRoIAlign位置合わせとオフセットを求め,これらの領域からDepthと3D Bounding Boxを推定する.時系列の推定結果に対して,時間・空間両方で軌跡として整合するように学習するロス関数を設定して学習する.
placeholder

新規性

時空間上の軌跡として整合することを制約として,2D画像シーケンスから3Dでの物体認識・追跡を行った.推定姿勢は推定されている深度から三次元対応点が重なるよう最適化問題を数値的に解くことで得る.同じ物体を各フレームで対応させることで隣接するフレームのみから軌跡全体を再構成できる.

結果

KITTI Traskingで評価し高性能な物体認識・トラッキングを実現.フレーム間の対応方法として再投影誤差を最小化する手法とフレームごとの局所座標系を対応させる手法を示し評価,いずれも良好なトラッキング性能だったが,数値的には前者がわずかに優れる.KITTIの生シーケンスとArgoverseデータセットに対しても提案法を適用して評価.

その他(なぜ通ったか?等)