Semantic View Synthesis

#184

summarized by : 古川遼

Hsin-Ping Huang, Hung-Yu Tseng, Hsin-Ying Lee, Jia-Bin Huang

どんな論文か？

セマンティックマスクから、自由視点の画像を合成するタスク semantic view synthesis を提案。そのタスクにおいて、色・disparity 画像の合成と multiple-plane image (MPI) 表現の予測からなる 2 段階の訓練・推論手法を提案。屋内外のシーンにおいて手法の有効性を確認。

新規性

タスクと手法が新規。セマンティックマスクから、2-stream のSPADE を用いて色と disparity を生成。色と disparity からMPI 表現 (各深度における色画像とアルファ画像)を予測。MPI 表現のカメラの相対姿勢と合わせて新しい視点の画像をレンダリング。訓練時は、色・disparity の合成と MPI 表現の予測を行う 2 つのモジュールは、別々に訓練を行う。

結果

ADE20K・ADE20K-outdoor・NYU のデータセットを使用。 U-Net・SPADE・SPADE+MPI・SPADE+3D Ken Burns のベースラインモデルと比較。定量評価では、提案手法が他手法より、中心・視点を変えた合成画像の FID が低く、視点を変えても FID が上がりにくかった。定性評価・ ablation study ・user study も実施し有効性を確認。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．