#136
summarized by : Teppei Kurita
Can You Read Me Now? Content Aware Rectification using Angle Supervision

どんな論文か?

OCRの高精度化に伴い、スマホのアプリとカメラで気軽に文書をスキャンできるようになってきたが、依然折り畳まれていたりクシャクシャな文書を正しく認識するのは難しい。そこで文書の向きや単語の位置、文書自体の形状を認識してRectificationする学習ベースの手法を提案。
placeholder

新規性

文書がしわになったり折れたりする線を予測しその不連続性を強調することで曲率推定を行い、角度回帰ロスを補完したことがポイント。

結果

高難易度である反り返った文書データセットにおいて、従来手法と比較しOCRエラーを20.2%、幾何学的エラーを14.1%、相対的に削減することに成功。

その他(なぜ通ったか?等)

非常にニーズの高い実用的な問題設定であり、結果の改善幅もインパクトがある。