#730
summarized by : Eisuke Yamagata
In Defense of Pre-Trained ImageNet Architectures for Real-Time Semantic Segmentation of Road-Driving Images

どんな論文か?

自動運転用のsemantic segmentationの計算資源を削減する新しい手法を提案する論文。
placeholder

新規性

計算資源を削減する従来法はscratchから学習した軽量化した畳み込みエンコーダを使用するのに対し、提案手法はImageNetでpretrainされたコンパクトなモデルを使用。さらに、受容野を拡大するためにspatial pyramid poolingを使用したモデルを提案している。

結果

GTX1080Tiで1024*2048の画像を39.9Hzで処理しつつCityscrapes Datasetで75.5%mIoU。従来の軽量化モデルを上回る精度。

その他(なぜ通ったか?等)

自動運転を想定した軽量化の実用性と従来法を上回る精度。