#1031
summarized by : Teppei Kurita
Assessing Image Quality Issues for Real-World Problems

どんな論文か?

目の見えない人が撮影した写真について、それを説明するキャプションをつける際に、どのような品質欠陥が課題になってくるかを調べた研究。
placeholder

新規性

クライドワーカーにキャプショニングをするかそれが出来ないかの判定に加え更に数種類の質的欠陥をラベルつけるように依頼。画像全体の14.8%が、画像内容を認識できないほど深刻に欠陥があることもわかった。逆に言うとこのような画像は自動的にフィルタリングできるとよく、そのような自動判定の応用例についても検討している。39181枚についてキャプショニングとラベル付けされたデータセットを提供している。

結果

約半数以上の画像が質的欠陥があり、その中で特に画像のボケとフレーミングの不備の割合が高いことがわかった。逆に明るすぎる・暗すぎるだったり回転の不備だったりはごく一部にすぎなかった。これらのことから、ビジョンを通して視覚障碍の方の体験を向上させるためには「手振れ補正」と「物体検出」の技術を発展させていくことが特に重要であることがわかった。

その他(なぜ通ったか?等)

視覚障碍者の支援のためのビジョン研究というビックピクチャーの社会的意義が大きい。今何が課題となっているか、というところをちゃんと導き出している。