Neural Data Server: A Large-Scale Search Engine for Transfer Learning Data

#105

summarized by : 岡本大和

Xi Yan, David Acuna, Sanja Fidler

クライアントが所有するデータに対して、（転移学習を前提に）機械学習モデルを構築したいとき、「数々ある公開データセットのうち、どれでPretrainしたモデルを利用すると最適か？」を判定する研究

そもそも問題設定が新しい。Federated Learningのようにクライアントデータの秘匿性を保つ工夫など、近年の関心ごとをおさえている点も評価できる。

ImageNetでpretrainした場合や、全ての公開データセットでpretrainした場合に比べて、提案手法で最適なデータセットを選定してpretrainした場合の方が、転移学習した後に高性能を達成。

Domain AdaptationやFederated Learningなど類似研究との関係性に丁寧に言及したうえで、相違点と問題設定の重要性を丁寧に述べている。そのうえで手法の有効性も示せている。

このページで利用されている画像は論文から引用しています．