#13
summarized by : shoji sonoyama
CTRL-C: Camera Calibration TRansformer With Line-Classification

どんな論文か?

単眼画像から水平/垂直線(infinite VP),画角(FoV),消失点(VP)を推定する問題設定. 画像と画像から抽出した線分からTransformerを用いて推定している.
placeholder

新規性

単眼画像からのカメラパラメータ推定にTransformerを取り入れたこと. 画像パッチとLine segmentのマルチモーダル的用いる方法を提案したこと.

結果

Google Street ViewとSUN360データセットを用いてup direction,pitch,roll,FoVを評価し,従来手法を凌駕する性能を得た.

その他(なぜ通ったか?等)

少なくとも1つ消失点と水平/垂直線があればカメラパラメータが推定可能なため,実質単眼カメラキャリブレーションの問題設定. 実装:https://github.com/jwlee-vcl/CTRL-C