#8
summarized by : Teppei Kurita
FroDO: From Detections to 3D Objects

どんな論文か?

マルチビューのRGB画像を入力として、オブジェクトの位置・ポーズ・正確な形状を推定する。
placeholder

新規性

軽い疎点群表現と密なSigned Distance Functions表現の両方に形状をデコードすることができる潜在表現を獲得するアーキテクチャにしたところが新規性。より高速な形状最適化が可能になった。

結果

シングルビュー、マルチビュー、およびマルチオブジェクトの実世界のデータセットのシーケンス上でアルゴリズムの効果を実証。既存手法と比較して高精度化を確認。

その他(なぜ通ったか?等)

「2つ(と言わず複数)のトレードオフのある表現方法だったり特徴量をデコードするように潜在表現を学習する」というアイデアに汎用性がある。