Exploit Clues From Views: Self-Supervised and Regularized Learning for Multiview Object Recognition

#473

summarized by : yamada ryosuke

Chih-Hui Ho, Bo Liu, Tz-Ying Wu, Nuno Vasconcelos

どんな論文か？

Multi-viewベースの三次元物体認識は認識精度においてPointCloudやVoxelと比較して優勢であることが多い，しかし，これらは前提としてオブジェクトを全範囲カバーする視点が必要であり，視点と画像に注釈を付与する必要もある．そこで，未知の視点にも対応可能なview invariant stochastic prototype embeddings (VISPE)を提案する．

新規性

Multi-viewベースの三次元物体認識に適したVISPEの提案．さらには，未知の視点にも対応可能であり，Randomizationやregularizationすることで従来の手法よりも識別精度が向上．

結果

従来の自己教師あり学習よりも認識精度が優れており，テストが未知の視点からのデータであっても対応可能であることを示した．さらに，metric learning embeddingsと比較してVISPEは学習時間の収束が早いことを確認した．

その他（なぜ通ったか？等）

実世界においてロボットが物体を認識することを前提として，従来手法では実応用不可能な課題を解決するための手法を提案している．そのための実験設定や論文のストーリーが明確であった．

このページで利用されている画像は論文から引用しています．