#439
summarized by : Naoya Chiba
ImVoteNet: Boosting 3D Object Detection in Point Clouds With Image Votes

どんな論文か?

RGB-Dに特化したVoteNetの拡張.VoteNetで提案したDeep Hough Votingを利用して,2Dのみの特徴量・3Dのみの特徴量・結合した特徴量での物体検出を学習.得られたネットワークを用いてテスト時には2Dと3Dを結合した特徴量で推論する.
placeholder

新規性

2Dから得らえることが期待される幾何学的・意味的・テクスチャ的な特徴量をVoteNetの枠組みに統合することを目指した.3DでVotingするために光線方向を考慮したPseudo 3D Voteを導入.ネットワーク全体で2Dと3Dの情報を両方とも活用するため, gradient blendingによる統合を行う.

結果

SUN RGB-DでSoTAを達成.Ablation Studyでは幾何学的・意味的・テクスチャ的な特徴がいずれも必要であることを確認している.Gradient blendingが有効であることも確認.

その他(なぜ通ったか?等)

VoteNet自体が革新的であったが,三次元点群に単に2Dの輝度値をマップするのではなく2Dでの特徴量(幾何学的・意味的・テクスチャ的)を取り出すことが重要であることを示した.