#378
summarized by : Tenga Wakamiya
Translate-to-Recognize Networks for RGB-D Scene Recognition

どんな論文か?

RGB-Dカメラからシーン認識を行うために変換認識ネットワークTRecgNetを設計した.
placeholder

新規性

シーン認識の精度向上のためにクロスモーダル変換とモダリティ固有の認識のタスクを統合するための統一されたフレームワークであるTRecgNetを設計した.変換タスクと認識タスクで同じエンコーダネットワークを共有するために変換情報を用いて認識タスクの学習を明示的に正規化することができ,最終的に汎化能力が向上した.

結果

SUN RGB-DとNYUD2データセットで実証し,SOTAな結果を残すことができた.

その他(なぜ通ったか?等)

タスクの問題に対して2つの視点からアプローチし,結果的に高い精度を残すことができたためだと考えられる.また,まだRGB-Dのシーン認識の手法が少ないためだと考えられる.