#820
summarized by : Masaki Taniguchi
BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation

どんな論文か?

fully convolutionalなインスタンスセグメンテーションの手法は二段階の手法と比べて高速に推論可能だが、精度の面で劣っていた。本論文では、低レベル特徴量と高レベルなattentionを両方使用するBlendMaskを提案し、高速な推論速度を保ちながら高精度な予測を可能にした。
placeholder

新規性

インスタンスセグメンテーションの従来手法にはトップダウンとボトムアップの2つのアプローチがある。両アプローチを同時に用いる既存の手法ではトップダウンとボトムアップの両アプローチを組み合わせる際にクロッピングや加重和などを用いていた。本論文はそれらの手法では各特徴の表現力のバランスが取れていない可能性があることを指摘しており、それを解決するためのBlendモジュールを提案した。

結果

COCOデータセットにおいて、ResNet-50バックボーンで37.0%のmAP、ResNet-101で41.3%のmAPを達成しており、Mask R-CNNを上回る精度と高速性を達成。また、学習に関しても半分の学習反復でTensorMaskをmask mAPで2.3ポイント上回ることに成功。

その他(なぜ通ったか?等)

この分野では推論速度が非常に重要であり、その点において計算速度の面で二段階の手法よりも優秀であるfully convolutionalな手法を精度面で大幅に底上げしたという点が評価された。また、Blenderモジュールが既存の手法に簡単に導入できるという点も貢献が大きい。