#144
summarized by : Shoma Iwai
Learned Image Compression With Discretized Gaussian Mixture Likelihoods and Attention Modules

どんな論文か?

Autoencoderベースの非可逆画像圧縮。従来手法はlatent codeの分布をガウス分布で表し、その平均・分散を予測していたが、ここでは混合ガウス分布で表す。これにより柔軟に分布を予測でき、圧縮性能が向上した。また、エンコーダ・デコーダに計算量を抑えたattention moduleを導入した。
placeholder

新規性

混合ガウス分布を導入した点。従来手法のNon-local attention networkを軽量化した点。

結果

PSNR、MS-SSIM共にSOTAを達成した。ablation studyではattention networkの簡略化による影響や混合ガウス分布による効果を示した。

その他(なぜ通ったか?等)