#579
summarized by : Ryota Suzuki
Aggregation Cross-Entropy for Sequence Recognition

どんな論文か?

シーケンス認識(文字列とか物体の数とか)のための,高速に評価可能なAggregation cross entropyを提案.どこにどの文字が割り当たっているか評価するのだと遅くなるので,ロスを取るときにはシーケンス順は無視して文字の出現回数(=aggregation)の差を評価することにする.
placeholder

新規性

2D(シーケンスが弧になっているような状況)で適用でき,かつ高速(式が4つのみ).Connectionist Temporal Classification (CTC)は1Dで低速.Attentionは2Dでいけるけど提案手法の方が速い.文字の出現回数でいいやというのもAttention的だが斬新に感じる.

結果

SOTA性能を出しつつ,CTC,Attentionより5倍高速.

その他(なぜ通ったか?等)

文字認識系の人じゃないと読むの時間かかりそうな構成.