#795
summarized by : Shoji Sonoyama
Bi3D: Stereo Depth Estimation via Binary Classifications

どんな論文か?

ステレオカメラ画像を入力とし、Depth画像を出力する問題設定。 Tesla V100を用いて100fps以上で推論可能な非常に高速なネットワークを提案した。
placeholder

新規性

高速な推論を行うためのBi3Dという手法を提案した。 Bi3Dでは入力されたステレオ画像からDepthが閾値よりも大きいor小さいかのみで高速に2値セグメンテーションするネットワークを用いる。 このネットワークを閾値を変えながら反復処理することで離散的でDepthを得たのち、Depthをrefineすることで高速に精度のよいDepthが得られる。

結果

KITTIデータセットとFlying Thingsデータセットを用いた評価にて、高速な推論速度でありながらSoTAに比肩する精度であることを示した。 実装公開予定:https://github.com/NVlabs/Bi3D

その他(なぜ通ったか?等)

推論速度と精度が両立している。アイデアもシンプルで実応用できそうに感じさせられる。