#394
summarized by : Hirokatsu Kataoka
End-to-End Camera Calibration for Broadcast Videos

どんな論文か?

バスケットボール/サッカーシーンにおけるカメラ校正をEnd-to-Endで実施。具体的には(1)コートのセグメンテーション、(2)カメラ姿勢推定、(3)Spatial Transform Net(STN)による変換行列推定を実行。
placeholder

新規性

バスケットボール/サッカーの試合映像のカメラ校正をEnd-to-Endな深層学習モデルにより実行することが新規性である。内的にはセマンティックセグメンテーション、カメラ姿勢初期化、変換行列の修正を行なっている。モデルは図の通りである。

結果

World Cup 2014 datasetを用いて評価。多種にわたる動的なシーンにおいてもベースとなる手法よりも高いカメラ校正を実現し、誤差の少ない推定を可能とした。変換行列(Homography)を求めたのちに俯瞰画像上に投影。

その他(なぜ通ったか?等)

カメラ校正、特にスポーツシーンにおいては複雑であるが、一括で変換行列を推定することができる点が評価された。