#529
summarized by : QIUYUE
Scene Parsing via Integrated Classification Model and Variance-Based Regularization

どんな論文か?

従来のScene Parsingは通常一つの識別器ですべての物体のカテゴリを識別,相似性高い物体に対してコンフューズする問題点がある.マルチ識別器の結果の統合をベースとしたモデルを提案.提案モデルは2つの基本構造から構成される:マルチ識別器を整合したintegrated識別器(特徴抽出,識別,リファイン),variance-based regularization(誤識別を抑制).
placeholder

新規性

従来のScene Parsingが一つのgeneral識別器でラベルを予測.この文章ではマルチ識別器からラベルを予測し,その結果を整合、調整によりラベルを予測するフレームワークを提案.

結果

NYU Depth v2, PASCAL-Context, SUN-RGBDなどのデータセットにおいてSOTAな精度を達成(DeepLab v3+, CCL&GMAなどより良いpAcc, mIoUを得られた).

その他(なぜ通ったか?等)

シンプルなモデルでSOTAな精度を達成した.マルチ識別ネットワークの結果をコンバインする考え方がシンプルで,ほかのタスクでも知見をもたらした.