#301
summarized by : Hirokatsu Kataoka
Where, What, Whether: Multi-Modal Learning Meets Pedestrian Detection

どんな論文か?

複数のモダリティを用いることにより、歩行者認識はより詳細なラベルを返却することができると主張。Where(正面画像|俯瞰画像)、What(高さ|奥行き)、Whether(Head|Arm|Body|Leg が映っているか否か)を認識する。
placeholder

新規性

Where, What, Whetherの推定において、実環境(Domain A)合成画像(Domain B)俯瞰画像(Domain C)をCycleGANにより行き来しながら所望の情報を獲得していく。

結果

2つのデータセットにてエラー率を著しく下げた。MR^-2指標において、Citypersonsでは49.3->18.7%、Caltech Pedestrianでは45.18->28.33%。

その他(なぜ通ったか?等)