#894
summarized by : Anonymous
CAM-Convs: Camera-Aware Multi-Scale Convolutions for Single-View Depth

どんな論文か?

RGB画像から深度を推定するタスクにおいて,RGB画像を撮影するカメラの違いに頑健にするため,カメラパラメータを陽に用いた畳み込みを行うCAM-convの提案.CAM-convは画像の主点,および画角を表現する計4チャネルを入力に付け加え,畳み込みを行う.
placeholder

新規性

RGB画像からの深度推定タスクにおいてカメラパラメータの違いが重要であることに着目し,カメラごとの違いをネットワークに学習させるCAM-convの提案した点

結果

2D-3D Semantics Datasetを用い,異なる焦点距離,センサーサイズの訓練画像および評価画像を用いて学習・評価を行ったところ,CAM-convを用いないモデルでは特定のカメラパラメータに過学習したのに対し,CAM-convを用いたモデルでは異なる,あるいは複数のカメラパラメータの画像を訓練に用いても,評価時に汎化.

その他(なぜ通ったか?等)

CAM-convそのものは極めて単純な工夫.しかし,カメラパラメータの違いが重要になるRGB画像からの深度推定というタスクを選ぶことによって,CAM-convの必要性・必然性が増している.