summarized by : Hiroaki Aizawa
Wenyu Han, Siyuan Xiang, Chenhui Liu, Ruoyu Wang, Chen Feng
人間は2Dに描かれたthree-view画像から,オブジェクトの3D形状を想像し,これらの空間的な関係推論することができる.では,DNNはどうだろうか?という問いから,DNNの空間的な推論能力を明らかにした研究.
three-viewから,view consistencyを持つ画像の選択, camera poseの推定, shape generationを含む3つの2D-3D推論タスクを持つSPARE3Dを提案.
実験では,SOTAな性能を持つCNNであってもSPARE3Dでは,ランダムな推論と同程度の性能だったことを明らかにした.