#417
summarized by : 角田良太朗
Towards Layer-Wise Image Vectorization

どんな論文か?

JPGやPNGのようなラスタ画像をSVG形式に変換する。従来手法はフォントや顔文字のような特定ドメイン限定であったり、セグメンテーションの前処理が必要であったりと汎用性に欠けており、本論文ではベジエ曲線を構成要素とするドメイン非依存の数値最適化によるレイヤー分割を提案する。
placeholder

新規性

真円を初期値とするベジエ曲線を1つずつ追加してレイヤー重ね合わせによりSVG形式に表現する。MSEで画素値を最適化する際に内部の塗りつぶし色が曲線内の模様に影響されないようエッジ付近でのみロスを取ること、また曲線の自己交差を防ぐようcontroll pointの配置に正則化を加えているのが工夫点。

結果

複雑なテクスチャを持つEmojiデータセット及びPicsデータセットを新規に用意し、それを用いて既存手法と比較し低いMSEを示す。またレイヤー分割数もかなり少なく、controll pointを動かすだけで2画像のinterpolationが自然と達成できることも示している。

その他(なぜ通ったか?等)

ベジエ曲線のcontroll pointのみをパラメータとする単純な数理最適化であり、DLでないのは非常に珍しい。汎化性が高いのも頷ける。しかしレイヤー分割数が自動決定でないのと、最適化に時間がかかる点が惜しい。公開実装を動かしたが数十分はかかる。 https://github.com/Picsart-AI-Research/LIVELayerwise-Image-Vectorization.