#94
summarized by : Shoma Iwai
A Spatial RNN Codec for End-to-End Image Compression

どんな論文か?

LSTMを使った可逆画像圧縮手法。通常のCNNは近隣の情報を主に使用するが、離れた部分の情報も使用したい。そこで画像をブロック、サブブロックに分割し、LSTMを使って隣接するサブブロックの情報を利用する。圧縮効率・実行速度共にSOTA手法を上回った。
placeholder

新規性

量子化のステップ幅を画像ごとに変化させる点。latent codeの分布を予測するためにHyperpriorを2つ使い、context modelを使わない点。RNNベースの手法でSOTAを達成した点。

結果

SOTA手法を上回った。特に低ビットレートでは大きく上回った。また、最新の手法で主流のcontext modelを使わないため、SOTA手法の約2500倍高速で実行可能である。

その他(なぜ通ったか?等)

RNNベースの画像圧縮は過去にもあったが、最新のCNNベース手法を上回ったというインパクト