#386
summarized by : horiem
GraFormer: Graph-Oriented Transformer for 3D Pose Estimation

どんな論文か?

2D-to-3D human pose estimation (人体のジョイントの 2 次元に投影された座標から 3 次元の座標を推定するタスク) において、GNN と Transformer を組み合わせた GraFormer を提案し、既存手法の 18% 程度のパラメータ数で SotA を達成した。
placeholder

新規性

GraAttention (Transformer + 隣接行列を learnable にした GCN) と ChebGConv (Differrard+ 2016) を 2D-to-3D human pose estimation に適用した。それぞれのモデルの新規性というよりは、グラフ構造を活かしつつ、Transformer による大域的な構造の考慮を両立させたことが新規性であると考えられる。

結果

手のデータセットや人体のデータセットを用いて、ほとんどで SotA を達成。また、それぞれのコンポーネントの効果を検証するために ablation study を行い、すべてのコンポーネントが性能向上に寄与していることが実証できた。

その他(なぜ通ったか?等)

https://github.com/Graformer/GraFormer