#763
summarized by : Hirokatsu Kataoka
Cars Can't Fly Up in the Sky: Improving Urban-Scene Segmentation via Height-Driven Attention Networks

どんな論文か?

「車は空を飛ばない」というタイトルから想像できるように、コンテキストを把握できるネットワークによりセマンティックセグメンテーションの性能向上する研究である。
placeholder

新規性

提案のHeight-driven Attention Networks (HANet)では主に高さ方向のコンテキストを把握しながら交通シーンのセマンティックセグメンテーションを実施する。図は画像を上・中・下に3分割した際の分布である。物体ごとに登場位置が異なるため、ネットワークが事前情報を把握できるというヒントである。提案のHANetはResNetのスキップコネクションに挿入していく形式である。

結果

交通シーンのセマンティックセグメンテーションタスクであるCityscapes datasetを適用。ShffleNet V2, MovileNet V2, ResNet-50, ResNet-101においてベースラインと+HANetを比較したところ、全てのモデルで1パーセント前後精度向上が見られた。さらに、Ablationの結果、ResNext-101にて83.2@mIoUを達成。

その他(なぜ通ったか?等)

Code and trained models are publicly available. https://github.com/shachoi/HANet