#361
summarized by : Anonymous
Geometric Representation Learning for Document Image Rectification

どんな論文か?

文書画像の修正において、Transformerを用いて幾何学的な制約を導入することで、最先端手法より良い精度があることを実証した。

新規性

文書画像において、歪んだ画像とリアル画像との間に幾何学的な制約が存在しているが、従来法が無視されている。この手法では明示的な幾何学的な表現を導入することにより、文書画像の修正のためのDocGeoNetを提案した。

結果

従来のBenchmarkでありDocUNet Benchmarと提案されたDIR300で提案法が最先端の手法より良い精度が確認できた。

その他(なぜ通ったか?等)

https://github.com/fh2019ustc/DocGeoNet