#679
summarized by : Katsuyuki Nakamura
Learning Geocentric Object Pose in Oblique Monocular Images

どんな論文か?

RGB衛星画像から建物の高さを推定する手法。U-Netをバックボーンとして、LiDARで得た建物高さを出力するように学習。視差による建物の倒れ込みを正射投影補正するためのgeocentric pose推定を経て、高さを求めることがポイント。
placeholder

新規性

一枚の衛星画像から建築物の高さを推定するネットワークおよびタスクが新規。Urban Semantic 3D (US3D)データセットのラベルと画像を拡張したものも公開。

結果

IGARSS(リモートセンシング分野のカンファレンス)で提案されているベースライン2種と比較して、高さ推定のRMSEでSoTA。さらに正射投影画像をセグメンテーションすることで、建物占有面積の検出においてもIoUが向上。

その他(なぜ通ったか?等)

リモートセンシング分野のアプリケーションをうまくCVPRのスコープに収めた印象。手法の説明が若干不透明。