#15
summarized by : Nakano Shuhei
Hyperbolic Vision Transformers: Combining Improvements in Metric Learning

どんな論文か?

Deep Metric Learningの画像検索分野。 教師あり学習
placeholder

新規性

- 双曲空間への埋め込みかつhyperbolic distances上でのcross-entropy lossの提案がユークリッド空間よりも優れていることを示した - vision transformers, hyperbolic embeddings, cross-entropy lossの組合せが画像検索タスクで有用であることを示した

結果

評価指標: Reall@K データセット: CUB-200-2011, Cars-196, Stanford Online Product, In-shop Clothes Retrieval エンコーダー: ViT-S(pre-trained: ViT-S, DeiT-S, DINO) 既存のユークリッド空間を扱うmetric learningの手法よりも高い精度を示した。

その他(なぜ通ったか?等)

https://github.com/htdt/hyp_metric