#11
summarized by : So Uchida
What if We Only Use Real Datasets for Scene Text Recognition? Toward Scene Text Recognition With Fewer Labels

どんな論文か?

Scene Text Recognition(STR)用のReal Datasetが近年増加していることを背景に,Real Datasetのみでの学習を検討した.
placeholder

新規性

データ量の都合からReal Datasetでの学習は従来検証されておらず,網羅的に検証し有効性を示した点.また,半教師/自己教師あり学習をSTRに導入した点.

結果

Synthetic Datasetに比べて少量の教師ありReal Datasetでも十分に学習可能(ベースラインに比べAccracyが±1%程度)であることを示し,ラベルなしデータ及びRotNet+Pseudo Labelingを活用してCRNNで8%, TRBAで4%程度性能向上.

その他(なぜ通ったか?等)

主著はICCV2019にSTRのベンチマークデータセットを再考する論文を出しており,本論文も同様に非常にフェアな比較を行なっており,貢献が分かりやすい.