#209
summarized by : Hirokatsu Kataoka
Common Objects in 3D: Large-Scale Learning and Evaluation of Real-Life 3D Category Reconstruction

どんな論文か?

3D Vision版のMS COCOを提案。MSCOCOに含まれる50物体において、1.9万物体、150万の複数視点画像を収集した。
placeholder

新規性

"非整備環境における(in-the-wild)"新規視点画像の生成ができる大規模画像データセットを構築して提供できることにしたことが大きな新規性。これにより、近年流行しているNeRFの研究に関して共通のベンチマークを提供可能とした。さらに、論文中ではTransformer構造をNeRFに取り入れたNerFormerを提案した。

結果

提案データセット内におけるベンチマーキングでは、Average statistics / PSNR @ # source views / PSNR @ target view difficultyなどの指標において多くの数値が最も良いスコアを叩き出している(が全て最高性能というわけではない)。あくまでもデータセットとともにベースラインを出したと言う印象。

その他(なぜ通ったか?等)

同論文はICCV 2021 におけるHonorable Mentionを獲得。この分野における共通ベンチマークとともに強いベースライン自体も提供したことがAward獲得論文として評価された。