#324
summarized by : Shuhei M Yoshida
DeepEMD: Few-Shot Image Classification With Differentiable Earth Mover's Distance and Structured Classifiers

どんな論文か?

クラス当たり1枚〜数枚の訓練画像から学習するfew-shot学習 (FSL)の手法。画像の局所的な特徴のマッチングに基づいた見方と、その実装としてend-to-endに学習可能なアーキテクチャを提案。
placeholder

新規性

FSLによる画像分類を局所的な特徴量のマッチング問題として定式化、距離尺度として画像検索等に用いられるearth mover's distance (EMD)を用い、end-to-endに学習可能なアーキテクチャを提案。その中で、EMDのパラメータである輸送コストと重みパラメータを特徴量から決める方法、全結合層を一般化しEMDから直接分類器を構成する構造化全結合層を提案。

結果

FSLの標準的なベンチマークであるminiImageNet, tieredImageNet, FS-CIFAR100, CUB200で評価。すべての設定において既存のSOTA手法を上回る精度を達成。

その他(なぜ通ったか?等)

FSLに対する新しい定式化であるが、説明やablation studyの納得性が高く、最終的な精度も高い。アルゴリズムの設計も良く練られていると感じる。