#545
summarized by : yusuke saito
Cost Volume Pyramid Based Depth Inference for Multi-View Stereo

どんな論文か?

多視点画像からの深度推定による3D再構成について、コストボリュームベースのニューラルネットワークを提案する。粗い解像度からコストボリュームピラミッドを構築、ネットワークの小型化・軽量化が可能になり、既存手法よりも高精度でかつ高速化を実現した。
placeholder

新規性

- 光学的な画像情報の流れを推定するための部分的なコストボリュームのアイデアを導入した点。3次元点群上に畳み込みを形成するのではなく、画像座標上に定義された規則的なグリッド上でコストボリュームを構造化 - マルチスケール3D-CNN正則化を用いて大規模な再検出フィールドをカバー、残差深度推定値の局所的な平滑化を促進することで、より高い精度を実現

結果

- DTU datasetでの精度比較では、学習ベースで平均精度は最もよく、また平均完全性と全体的な再構成品質はジオメトリベースも含めて最も良い結果を示した。 - 同サイズの深度mapの条件で、Point-MVSNetより6倍速く,消費するGPUメモリは6倍少なくなる。また同時に精度も良い。

その他(なぜ通ったか?等)

- 光学的なコストボリュームのアイデアを、三次元再構成に導入し、多くの指標でSOTAを実現した点。 - また、高精度でありながら省メモリ・高速化を実現している点。