#105
summarized by : 岡本大和
Neural Data Server: A Large-Scale Search Engine for Transfer Learning Data

どんな論文か?

クライアントが所有するデータに対して、(転移学習を前提に)機械学習モデルを構築したいとき、「数々ある公開データセットのうち、どれでPretrainしたモデルを利用すると最適か?」を判定する研究
placeholder

新規性

そもそも問題設定が新しい。Federated Learningのようにクライアントデータの秘匿性を保つ工夫など、近年の関心ごとをおさえている点も評価できる。

結果

ImageNetでpretrainした場合や、全ての公開データセットでpretrainした場合に比べて、提案手法で最適なデータセットを選定してpretrainした場合の方が、転移学習した後に高性能を達成。

その他(なぜ通ったか?等)

Domain AdaptationやFederated Learningなど類似研究との関係性に丁寧に言及したうえで、相違点と問題設定の重要性を丁寧に述べている。そのうえで手法の有効性も示せている。