#536
summarized by : Hideki Tsunashima
Spectral Metric for Dataset Complexity Assessment

どんな論文か?

データセットの複雑度を測る指標を提案した論文。 本論文はCNNを用いたクラス分類のエラー率に強い相関がある複雑度を測る指標を提案した。 この手法は既存手法に比べて実行時間が短く、データ分布に事前分布を仮定する必要がない。 また、本手法はデータセット削減を図る指標においても機能し、実際にデータセットを削減を行った。
placeholder

新規性

データセットの複雑度を測るCumulative Spectral Gradient(CSG)を提案した点。

結果

11個のクラスラベルのアノテーションを持つデータセットにおいて既存手法よりもCNNのエラー率に対して相関がとても高い値を出し、実行時間も100倍以上高速化することに成功している。 また、データセット削減の検証をAlexNetを用いたCIFAR-10で行っており、1クラス当たりのサンプル数を1500程度まで減らしても10%ほどの精度低下(元のCIFAR-10では82%)で抑えている。

その他(なぜ通ったか?等)

データセットの複雑度を測るにあたりCNNのエラー率に強い相関があり、既存手法に比べて圧倒的に相関が強く、実行時間も100倍以上高速化しており、データセット削減にも有用であるという超強力な手法を提案したため通ったと考えられる。 CV分野でのインパクトとしては非常に高く、ベストペーパーとしても遜色ないのではないかと感じた。