Predicting Goal-Directed Human Attention Using Inverse Reinforcement Learning

#186

summarized by : Kensho Hara

Zhibo Yang, Lihan Huang, Yupei Chen, Zijun Wei, Seoyoung Ahn, Gregory Zelinsky, Dimitris Samaras, Minh Hoai

どんな論文か？

従来の視線推定は特に何のタスクもない状態で自由に画像を見たときの視線を推定しているのに対して，この研究では特定の物体を探すというタスクが与えられたときの視線の遷移を推定するという問題設定を研究．料理が運ばれてきたときにはフォークやナイフを探すからそっちに目が行く，というような．

新規性

逆強化学習により探索中の視線の遷移を推定する手法を提案．また，COCO-Search18という10人の実験協力者に6202枚の画像を見てもらったときの視線を計測したデータセットを作成．18種類の物体の中からターゲットの物体として一つを設定し，それを探すというタスクでの視線を計測し，30万の視線データを収集．

結果

ベースライン（ランダム，物体検出器使用など）よりもCOCO-Search18での学習により高い性能（人の視線遷移に近く探索効率も良い）を達成．

その他（なぜ通ったか？等）

データセット収集頑張っててすごい．公開もしている模様．https://github.com/cvlab-stonybrook/Scanpath_Prediction

このページで利用されている画像は論文から引用しています．