- …
- …
#504
summarized by : Shintaro Yamamoto
どんな論文か?
3動画を動画をHMDにより見る際、360°全体ではなく特定の表示領域のみを見る。そこで、360°動画のvisual qualityを表示領域ごとに分割して求めることで、動画全体に対して推定する手法を提案。
新規性
Viewport-based convolutional neural network(V-CNN)を提案した。V-CNNは2つのステップから構成される。(1)入力の360°動画から表示領域候補を求める。(2)各表示領域候補よりサリエンシーを求め、領域ごとのvisual qualityを求める。領域ごとの算出結果を用いて動画全体のvisual qualityを求める。
結果
VQA-ODVデータセットにおいて、PLCC, SROCC, KROCC, RMSE, MAEそれぞれの評価尺度でのSOTAを更新した。
その他(なぜ通ったか?等)
- …
- …