#343
summarized by : Sou Uchida
Learning Image and Video Compression Through Spatial-Temporal Energy Compaction

どんな論文か?

微分可能な量子化とエントロピー推定を組み込んだConvolutional Autoencoderベースの画像圧縮手法の提案.圧縮されたデータと復号されたデータの空間的なエネルギー関数を誤差関数に追加して学習することで,高い圧縮性能を達成することができる.動画圧縮においては,時間的なエネルギー関数を罰則項に加える.
placeholder

新規性

既存手法ではあまり検討されてこなかった圧縮後のデータの空間・時間的なエネルギー関数がうまく小さくなっているかどうかについて検討した点.

結果

圧縮率(BBP)ごとのMS-SSIMを用いて定量評価.静止画(Kodak, CLICデータセット)では,任意の圧縮率で既存手法を上回る精度を達成.動画(VTLデータセット)では,高圧縮率においてHEVCに迫る品質を持つことを確認.

その他(なぜ通ったか?等)