#17
summarized by : So Uchida
Sequence-to-Sequence Contrastive Learning for Text Recognition

どんな論文か?

文字認識用のContrastive Learning手法としてSeqCLRを提案.
placeholder

新規性

文字の配置に意味があるため,文字認識における表現学習手法はRotNetなどの単純な手法に限られてきた.本論文では文字列の意味を損なわないAugmentationや系列要素マッチングの工夫によりContrastive Learningを導入することを可能にしている.

結果

エンコーダを固定する場合,SeqCLRはSimCLRに比べ大幅に改善.このとき系列特徴をwindow毎で比較する方法が最も性能が良い.またFine-tuningしても同様の結果が得られるが,デコーダがCTCの場合は系列特徴をwindow毎で比較する方が良い.

その他(なぜ通ったか?等)