- …
- …
#850
summarized by : Ryota Natsume
新規性
Video descriptionのための、Adversarial Inferenceを提案。各クリップに対して、説明文を漸進的にサンプルしていき、その中からdiscriminatorのscoreが高いものを選ぶ。discriminatorは、「ビデオとの見た目の関係性」「言葉の多様さ流暢さ」「文の一貫性」の三つのハイブリッド型を提案
結果
Activity Net Captions datasetで評価を行い、ユーザが提案手法で生成された文章を好むことを確認。
その他(なぜ通ったか?等)
- …
- …