#54
summarized by : Masuyama Yoshiki
VisualEchoes: Spatial Image Representation Learning through Echolocation

どんな論文か?

音の反射に使った深度推定(エコーロケーション)に関する研究.主な貢献は2つ.(1)単眼深度推定にエコーの情報が有効であること示した.(2)画像とエコーの情報のみを使った表現学習(VisualEcho)を提案した.得られた表現は深度推定以外にも,法線推定やナビゲーションで有効性を確.
placeholder

新規性

エコーロケーションを使った研究は複数存在するが、(2)のような画像の表現学習に適用した点は新しい.

結果

VisualEchoによる事前学習が複数のダウンストリームタスクで確認している.SOTAな性能を達成したという主張はないが,有効性はきちんと示されている.

その他(なぜ通ったか?等)