Cost Volume Pyramid Based Depth Inference for Multi-View Stereo

#545

summarized by : yusuke saito

Jiayu Yang, Wei Mao, Jose M. Alvarez, Miaomiao Liu

どんな論文か？

多視点画像からの深度推定による3D再構成について、コストボリュームベースのニューラルネットワークを提案する。粗い解像度からコストボリュームピラミッドを構築、ネットワークの小型化・軽量化が可能になり、既存手法よりも高精度でかつ高速化を実現した。

新規性

- 光学的な画像情報の流れを推定するための部分的なコストボリュームのアイデアを導入した点。3次元点群上に畳み込みを形成するのではなく、画像座標上に定義された規則的なグリッド上でコストボリュームを構造化 - マルチスケール3D-CNN正則化を用いて大規模な再検出フィールドをカバー、残差深度推定値の局所的な平滑化を促進することで、より高い精度を実現

結果

- DTU datasetでの精度比較では、学習ベースで平均精度は最もよく、また平均完全性と全体的な再構成品質はジオメトリベースも含めて最も良い結果を示した。 - 同サイズの深度mapの条件で、Point-MVSNetより6倍速く，消費するGPUメモリは6倍少なくなる。また同時に精度も良い。

その他（なぜ通ったか？等）

- 光学的なコストボリュームのアイデアを、三次元再構成に導入し、多くの指標でSOTAを実現した点。 - また、高精度でありながら省メモリ・高速化を実現している点。

このページで利用されている画像は論文から引用しています．