#572
summarized by : QIUYUE
LVIS: A Dataset for Large Vocabulary Instance Segmentation

どんな論文か?

大規模Instance SegmentationデータセットLVISの提案.LVISが164k画像,1000+entry-level物体カテゴリ,2.2M+のセマンティックマスクから構成される.LVISがInstance Segmentationや物体検出,更に,画像中のカテゴリ数の分布はLong-tailedで,Low-shot detection taskのためのデータセットとしても使える
placeholder

新規性

大規模なInstance Segmentationデータセットの提案.LVISの分布がLong-tailedで,大量なカテゴリに対しInstance数が少ない.このようなところから現在流行っているLow-shot Learningのために用いられる.

結果

MS COCOやOpen Imagesなどと比べ,LVISデータセットは比較的にLong-tailed. MS COCOとADE20Kと比べ,マスクアノテーションの質が高い.Mask R-CNNがMS COCOとLVISデータセットにおいて同レベルなbox APとmask APを得られた.

その他(なぜ通ったか?等)

FAIR, Ross Girshickが参加して開発したデータセット. Low-shot learningをベンチマークできる