#950
summarized by : Naoya Chiba
KeyPose: Multi-View 3D Labeling and Keypoint Estimation for Transparent Objects

どんな論文か?

深度の計測が難しい半透明物体についてのデータセット(Transparent Object Dataset)の作成と物体認識手法KeyPoseの提案.ロボットを用いて自動で透明な物体にラベリングするためのパイラインにより半自動でデータセットを構築できる.KeyPoseではステレオ画像から物体位置を推定するため,CNNでマップを生成し物体位置を推定する.
placeholder

新規性

半透明物体の認識のためのデータセットを作成し公開した.深度についての正解データを獲得するためにロボットアームとAzure Kinectを用いて計測,さらに不透明な参照オブジェクトと置き換えて計測することで深度の真値も記録する.

結果

DenseFusionと比較して高精度な物体認識を実現.DenseFusionに深度についての真値を与えたとしても,ステレオの2D画像のみを用いる提案法のほうが精度良く推定できた.複数キーポイントによる姿勢推定も実現.

その他(なぜ通ったか?等)

透明物体の認識は実用上重要な問題設定であるにも関わらずデータセット作成自体が困難で深層学習による解決が難しい課題だったため,データセットを作成して問題にアプローチしたことは重要な成果と考えられる.