- …
- …
#545
summarized by : yusuke saito
どんな論文か?
多視点画像からの深度推定による3D再構成について、コストボリュームベースのニューラルネットワークを提案する。粗い解像度からコストボリュームピラミッドを構築、ネットワークの小型化・軽量化が可能になり、既存手法よりも高精度でかつ高速化を実現した。
新規性
- 光学的な画像情報の流れを推定するための部分的なコストボリュームのアイデアを導入した点。3次元点群上に畳み込みを形成するのではなく、画像座標上に定義された規則的なグリッド上でコストボリュームを構造化
- マルチスケール3D-CNN正則化を用いて大規模な再検出フィールドをカバー、残差深度推定値の局所的な平滑化を促進することで、より高い精度を実現
結果
- DTU datasetでの精度比較では、学習ベースで平均精度は最もよく、また平均完全性と全体的な再構成品質はジオメトリベースも含めて最も良い結果を示した。
- 同サイズの深度mapの条件で、Point-MVSNetより6倍速く,消費するGPUメモリは6倍少なくなる。また同時に精度も良い。
その他(なぜ通ったか?等)
- 光学的なコストボリュームのアイデアを、三次元再構成に導入し、多くの指標でSOTAを実現した点。
- また、高精度でありながら省メモリ・高速化を実現している点。
- …
- …