#911
summarized by : Masaki Taniguchi
CascadePSP: Toward Class-Agnostic and Very High-Resolution Segmentation via Global and Local Refinement

どんな論文か?

最新のCNNベースのセグメンテーション手法では、学習に用いた画像の解像度より著しく大きい画像に対しては正確な予測ができないという問題がある。そこで、本論文では他手法で予測された不正確なマスクを局所的な境界を修正することで高解像度な画像でのセグメンテーション性能を底上げするCascadePSPネットワークを提案する。
placeholder

新規性

これまでにも他手法のマスクを精錬して性能を上げるような手法はあったが、それらでは学習に高解像度な画像データセットが必要であった。そこで、本論文では写真と粗い解像度でのマスクから一段階精細なマップを作成するモデルを学習させ、それを再帰的に用いることで、高解像度なデータセットでの学習を必要としない精錬手法を提案した。

結果

各ベースライン手法にCascadePSPを加えることで各手法のパフォーマンスを向上できる事をPASCAL VOC 2012、BIG dataset(後述)、ADE20Kの3つのデータセット上で確認。また、既存の精錬手法よりも高い性能を示すことを示した。

その他(なぜ通ったか?等)

同一のネットワークを再帰的に利用することで利用可能な解像度に上限が無いアーキテクチャを提案したという点でこの分野における貢献が大きいと判断されたと思う。また、高解像度シーンでのセマンティックセグメンテーションの性能計測用のBIG datasetを提供している点も分野にとって重要である。