A Spatial RNN Codec for End-to-End Image Compression

#94

summarized by : Shoma Iwai

Chaoyi Lin, Jiabao Yao, Fangdong Chen, Li Wang

LSTMを使った可逆画像圧縮手法。通常のCNNは近隣の情報を主に使用するが、離れた部分の情報も使用したい。そこで画像をブロック、サブブロックに分割し、LSTMを使って隣接するサブブロックの情報を利用する。圧縮効率・実行速度共にSOTA手法を上回った。

量子化のステップ幅を画像ごとに変化させる点。latent codeの分布を予測するためにHyperpriorを２つ使い、context modelを使わない点。RNNベースの手法でSOTAを達成した点。

SOTA手法を上回った。特に低ビットレートでは大きく上回った。また、最新の手法で主流のcontext modelを使わないため、SOTA手法の約2500倍高速で実行可能である。

RNNベースの画像圧縮は過去にもあったが、最新のCNNベース手法を上回ったというインパクト

このページで利用されている画像は論文から引用しています．