Scene Parsing via Integrated Classification Model and Variance-Based Regularization

#529

summarized by : QIUYUE

Hengcan Shi, Hongliang Li, Qingbo Wu, Zichen Song

どんな論文か？

従来のScene Parsingは通常一つの識別器ですべての物体のカテゴリを識別，相似性高い物体に対してコンフューズする問題点がある．マルチ識別器の結果の統合をベースとしたモデルを提案．提案モデルは2つの基本構造から構成される：マルチ識別器を整合したintegrated識別器(特徴抽出，識別，リファイン)，variance-based regularization(誤識別を抑制).

新規性

従来のScene Parsingが一つのgeneral識別器でラベルを予測．この文章ではマルチ識別器からラベルを予測し，その結果を整合、調整によりラベルを予測するフレームワークを提案．

結果

NYU Depth v2, PASCAL-Context, SUN-RGBDなどのデータセットにおいてSOTAな精度を達成(DeepLab v3+, CCL&GMAなどより良いpAcc, mIoUを得られた)．

その他（なぜ通ったか？等）

シンプルなモデルでSOTAな精度を達成した．マルチ識別ネットワークの結果をコンバインする考え方がシンプルで，ほかのタスクでも知見をもたらした．

このページで利用されている画像は論文から引用しています．