#511
summarized by : 角田良太朗
CamLiFlow: Bidirectional Camera-LiDAR Fusion for Joint Optical Flow and Scene Flow Estimation

どんな論文か?

RGBDの隣接フレームからopticalおよびscene flowを推定する。RGB画像とLiDARデータを融合する方法として従来はEarlyFusionおよびLateFusionのいずれかが用いられてきたが、そのいずれも問題があることを踏まえて、本論文ではmultistageのbidirectionalなfusionを新規に提案している。
placeholder

新規性

BidirectionalFusionに加えてLiDARデータは点群ベースで扱っており、それをRGBからの特徴量とうまくfuseさせるために2D<=>3D間の補間モジュールを挟み込むことを提案。またdepthに応じてLiDARの点群密度が異なる問題に対して、分布を一様にするための新しい正規化方法を提案している。

結果

FlyingThingおよびKITTIにおいてRAFT3Dよりも良い精度を1/6程度のパラメータ数で達成。また新提案のfuse手法の効果も実証している。

その他(なぜ通ったか?等)

深い考察を踏まえての改善手法提案という形ではないが、early/late fusionの問題は数年前からずっと指摘されていた問題であり、そこに新規の改善手法を出した点が高評価。 Depth completionタスクにも使えそうである。 https://github.com/MCG-NJU/CamLiFlow