summarized by : Masuyama Yoshiki
Ruohan Gao, Changan Chen, Ziad Al-Halah, Carl Schissler, Kristen Grauman
音の反射に使った深度推定(エコーロケーション)に関する研究.主な貢献は2つ.(1)単眼深度推定にエコーの情報が有効であること示した.(2)画像とエコーの情報のみを使った表現学習(VisualEcho)を提案した.得られた表現は深度推定以外にも,法線推定やナビゲーションで有効性を確.
エコーロケーションを使った研究は複数存在するが、(2)のような画像の表現学習に適用した点は新しい.
VisualEchoによる事前学習が複数のダウンストリームタスクで確認している.SOTAな性能を達成したという主張はないが,有効性はきちんと示されている.