#170
summarized by : Masanori YANO
Ego4D: Around the World in 3,000 Hours of Egocentric Video

どんな論文か?

Meta AIのEgo4Dプロジェクトによる、一人称視点の動画を中心としたマルチモーダルなデータセットに関する論文。
placeholder

新規性

世界の日常生活からの学習に取り組むため、一人称視点の動画に加え、音声、3次元メッシュ、複数のカメラ視点などのデータも収集し、5種類のベンチマークを含むEgo4Dデータセットを構築した。モデルの過学習を避けるため、カメラは統一せず複数の機種を使用している。

結果

大学や研究所の14チームがデータを収集し、9カ国の74地点、931名の参加者による3,670時間の動画を含むデータセットを構築した。

その他(なぜ通ったか?等)

データセットの規模と、多様性の確保に努めたことで通ったと考えられる。20組織の85名の著者による論文で、65ページのSupplementary Materialにはデータセットの分析情報や社会的影響、5種類のベンチマークの詳細などが解説されている。プロジェクトページ( https://ego4d-data.org/ )が公開されている。