#84
summarized by : Keisuke Kamahori
Length-Controllable Image Captioning

どんな論文か?

Image captioning において、文章の長さを指定できるようにする手法と、生成する文章の長さに依存しない計算量でキャプションを生成するネットワーク(LaBERT)の提案。
placeholder

新規性

長さレベルの概念を導入することで、様々な長さのキャプションを生成できるようにした。 また非自己回帰モデルによって、文章の長さに依存しない計算量でキャプションを生成できるネットワークを設計した。

結果

既存のネットワークに文章の長さに関する項を加えることで、より高精度かつ伸縮可能なキャプションを生成できた。LaBERT では、より多様で正確な長さのキャプションを生成できた。

その他(なぜ通ったか?等)

https://github.com/bearcatt/LaBERT