VisualEchoes: Spatial Image Representation Learning through Echolocation

#54

summarized by : Masuyama Yoshiki

Ruohan Gao, Changan Chen, Ziad Al-Halah, Carl Schissler, Kristen Grauman

音の反射に使った深度推定（エコーロケーション）に関する研究．主な貢献は２つ．（１）単眼深度推定にエコーの情報が有効であること示した．（２）画像とエコーの情報のみを使った表現学習（VisualEcho）を提案した．得られた表現は深度推定以外にも，法線推定やナビゲーションで有効性を確．

エコーロケーションを使った研究は複数存在するが、（2）のような画像の表現学習に適用した点は新しい．

VisualEchoによる事前学習が複数のダウンストリームタスクで確認している．SOTAな性能を達成したという主張はないが，有効性はきちんと示されている．

このページで利用されている画像は論文から引用しています．