#785
summarized by : Masaki Taniguchi
Deep Polarization Cues for Transparent Object Segmentation

どんな論文か?

写真内の透明オブジェクトに対するインスタンスセグメンテーションタスクにおいて、現在主流のRGB画像ベースの手法では満足な結果を得ることができない。特に印刷された透明オブジェクトの写真に対しては非常に脆弱である。そこで、本論文では偏光カメラを用いた撮像とそれを扱うための新しいCNNフレームワークを提案した。また、実際のロボットアームによるビン把持タスクでの実用結果も示す。
placeholder

新規性

偏光カメラを用いることで、印刷した疑似オブジェクトに対しても頑健な単眼インスタンスセグメンテーション手法を実現した。また、偏光画像を扱うためのattentionベースの新しいCNNフレームワー(Polarized CNN)を提案した。

結果

Clutter, Novel Environments, Print-Out Spoofs, Robotic Bin Pickingの4つのデータセット全てに対してベースライン手法を上回る精度を記録。また、実際にロボットアームを用いて実際にビン拾いタスクを行った実験でもベースラインモデルより高い精度を記録した。

その他(なぜ通ったか?等)

RGB画像のみを用いる手法と比べて、偏光カメラを用いることが非常に顕著に優位であることを示した点と、ロボットアームを用いた実際のシーンでの貢献を示した部分が評価された。