- …
- …
#529
summarized by : QIUYUE
どんな論文か?
従来のScene Parsingは通常一つの識別器ですべての物体のカテゴリを識別,相似性高い物体に対してコンフューズする問題点がある.マルチ識別器の結果の統合をベースとしたモデルを提案.提案モデルは2つの基本構造から構成される:マルチ識別器を整合したintegrated識別器(特徴抽出,識別,リファイン),variance-based regularization(誤識別を抑制).
新規性
従来のScene Parsingが一つのgeneral識別器でラベルを予測.この文章ではマルチ識別器からラベルを予測し,その結果を整合、調整によりラベルを予測するフレームワークを提案.
結果
NYU Depth v2, PASCAL-Context, SUN-RGBDなどのデータセットにおいてSOTAな精度を達成(DeepLab v3+, CCL&GMAなどより良いpAcc, mIoUを得られた).
その他(なぜ通ったか?等)
シンプルなモデルでSOTAな精度を達成した.マルチ識別ネットワークの結果をコンバインする考え方がシンプルで,ほかのタスクでも知見をもたらした.
- …
- …