#309
summarized by : 金城 忍
Learning the Best Pooling Strategy for Visual Semantic Embedding

どんな論文か?

任意の数の特徴量ベクトルの入力に対して、それぞれから降順に任意の数の要素を取り出し、新しい集合を作成する一方で、それぞれの位置情報と重みをもった埋め込みベクトルを取得することで、適応的に最適なプーリング手法を達成

新規性

適応的なプーリング手法の提案という点で新規

結果

COCO 5-fold 1K Test、Flickr30K 1K Testによる画像からテキスト及びその逆の評価ではRSUM値で、既存手法より良い結果を達成し、MSR-VTT、VATEXによる映像からテキスト及びその逆の評価でもRSUM値で、既存手法より良い結果を達成

その他(なぜ通ったか?等)