#495
summarized by : Soma Nonaka
DatasetGAN: Efficient Labeled Data Factory With Minimal Human Effort

どんな論文か?

学習済みのStyleGANの特徴量からアノテーションを生成する「Style Interpreter」ネットワークを学習し、StyleGANで生成した画像に対して自動的にアノテーションをつけることで大規模なデータセットを作成する手法を提案した。Style Interpreter は比較的少数の教師ありデータで訓練できるため、実質的に少数のアノテーションで無制限の教師ありデータを生成できる。
placeholder

新規性

GANによって生成した画像に対して、自動的にアノテーションを付与するネットワークを学習する点が新しい。StyleGANの特徴量は、アノテーションを生成するために十分な情報を持っているという仮説に基づき、シンプルなネットワークでそれを実現できることを示している。

結果

semantic segmentationとkeypoint detectionの二つのタスクで評価した。提案手法で作成したデータセットで訓練したモデルは、ほかのデータセットからtransfer-learningやsemi-supervised learningしたものよりも高い精度を示した。また、提案手法を拡張することで、StyleGANで生成した画像から3Dモデルを作成することに成功した。

その他(なぜ通ったか?等)

評価実験が非常に網羅的に行われている。 project pageへのリンク:https://nv-tlabs.github.io/datasetGAN/