#107
summarized by : Yue Qiu
Captioning Images Taken by People Who Are Blind

どんな論文か?

従来のImage captioningデータセットは実環境応用をターゲットする物が少ない.この研究で盲人のためのデータセットを提案,提案データセットは39,000画像から構成,すべての画像が盲人から集めた.また,画像ごとに5Captioningを人工により追加した.提案データセットと従来のImage captioningデータセットと網羅的比較,既存手法のBenchmarkを行った.
placeholder

新規性

①実Userの利用をTargeしたImage captioningデータセットの提案;②盲人のためのデータセットの提案,提案データセットの画像がすべて盲人より集めた;③実用環境でかならず良い画像を得られるわけではないので,提案の設定は従来良く取れている画像から構成されるデータセットより実用性が高い.

結果

①従来のImage captioningデータセットと比べて,質の低い画像が多い;②既存の手法が他のImage captioningより性能が劣り,提案データセットはよりChallengeで,今後の研究のBenchmarkとして用いられる.

その他(なぜ通ったか?等)

①盲人のためのデータセット,かなり社会的貢献度が高い;②VizWiz challengeのグループの論文、Challengeも開いている.