FroDO: From Detections to 3D Objects

summarized by : Teppei Kurita

Martin Rünz, Kejie Li, Meng Tang, Lingni Ma, Chen Kong, Tanner Schmidt, Ian Reid, Lourdes Agapito, Julian Straub, Steven Lovegrove, Richard Newcombe

マルチビューのRGB画像を入力として、オブジェクトの位置・ポーズ・正確な形状を推定する。

軽い疎点群表現と密なSigned Distance Functions表現の両方に形状をデコードすることができる潜在表現を獲得するアーキテクチャにしたところが新規性。より高速な形状最適化が可能になった。

シングルビュー、マルチビュー、およびマルチオブジェクトの実世界のデータセットのシーケンス上でアルゴリズムの効果を実証。既存手法と比較して高精度化を確認。

「２つ（と言わず複数）のトレードオフのある表現方法だったり特徴量をデコードするように潜在表現を学習する」というアイデアに汎用性がある。

このページで利用されている画像は論文から引用しています．