#92
summarized by : Takuma Yagi
SpherePHD: Applying CNNs on a Spherical PolyHeDron Representation of 360deg Images

どんな論文か?

全方位カメラで撮影した画像に対してCNNを適用する際に発生する歪みと不連続性の問題を解消する全方位画像のための球状多面体表現および新しい畳み込み層・プーリング層の提案。回転不変性と不連続性の解消を実現。
placeholder

新規性

正距円筒図法に基づく投影の欠点を指摘し、分解能のばらつきを最小化するために球状多面体(正20面体)に画像を投影、そのうえで機能する畳み込みカーネル・プーリング操作を定義。

結果

分類(MNIST)、検出(SYNTHIA)、セグメンテーション(Stanford2D3D)のすべてにおいて優位性を実証。

その他(なぜ通ったか?等)

全方位画像の認識の注目度がここ数年上がっている中で実直に問題解決を行っているのはすごい。頭部角度が大きく変化する一人称視点映像解析を踏まえると極めて重要な貢献と思う。