Cascade Cost Volume for High-Resolution Multi-View Stereo and Stereo Matching

#53

summarized by : Shoji Sonoyama

Xiaodong Gu, Zhiwen Fan, Siyu Zhu, Zuozhuo Dai, Feitong Tan, Ping Tan

どんな論文か？

ステレオカメラ等の複数画像(カメラの内部・外部パラメータは既知とする)を入力とし、3D形状を復元する問題設定。 MVSNetやPSMNet等のcost volumeを持つ手法では画像解像度と視差推定範囲によってメモリ使用量と処理時間が3乗のオーダーで増大する。本論文でメモリ使用量と処理時間等の計算コストを削減し、性能を向上させたcascade cost volumeを提案する。

新規性

従来のcost volumeをそのまま置き換え可能なcascade cost volumeを提案したことにある。 cascade cost volumeは解像度の異なる複数の視差画像を推定し、低解像度の視差画像で得られた視差をもとに視差推定の範囲を絞っていく。視差推定の範囲はパラメータで与える。

結果

DTUベンチマークにて、メモリ使用量と実行時間をそれぞれ50%と60%程度削減しつつ、精度を23%程度したことが確認されSoTAを達成した。また、KITTI等のステレオ問題でも既存手法にcascade cost volumeを組み込むことでコストの削減と精度の向上を確認されている。本論文の実装はhttps://github.com/alibaba/cascade-stereoで公開されている。

その他（なぜ通ったか？等）

従来のcost volumeをそのまま置き換え可能と主張しており、汎用性が高い。古典的な多段処理とDeepを組み合わせが興味深い。

このページで利用されている画像は論文から引用しています．