Viewport Proposal CNN for 360deg Video Quality Assessment

#504

summarized by : Shintaro Yamamoto

Chen Li, Mai Xu, Lai Jiang, Shanyi Zhang, Xiaoming Tao

どんな論文か？

3動画を動画をHMDにより見る際、360°全体ではなく特定の表示領域のみを見る。そこで、360°動画のvisual qualityを表示領域ごとに分割して求めることで、動画全体に対して推定する手法を提案。

新規性

Viewport-based convolutional neural network(V-CNN)を提案した。V-CNNは2つのステップから構成される。(1)入力の360°動画から表示領域候補を求める。(2)各表示領域候補よりサリエンシーを求め、領域ごとのvisual qualityを求める。領域ごとの算出結果を用いて動画全体のvisual qualityを求める。

結果

VQA-ODVデータセットにおいて、PLCC, SROCC, KROCC, RMSE, MAEそれぞれの評価尺度でのSOTAを更新した。

その他（なぜ通ったか？等）

このページで利用されている画像は論文から引用しています．