#372
summarized by : Takuji Tahara
Dynamic Graph Message Passing Networks

どんな論文か?

CNNが不得意とする画像内の大域的な関係性の獲得には全結合グラフが有効と考えられるが、計算量や情報の冗長性の課題があった。この課題を解決すべく、入力に基づいて動的にグラフ構造を構成する Dynamic Graph Message Passing Network を提案。大域的な関係性が重要とされる segmentation 等において、計算効率だけでなく性能についても優れた結果を示した。
placeholder

新規性

動的に全結合よりも疎なグラフを構成するフェーズにおいて二つの貢献を主張。一つは各 node(pixel) が受け取る message の発信元となる node 集合を動的に sampling すること、もう一つは message の受け渡しに用いる重みと隣接行列も動的に予測することである。これらのいずれも学習可能なパラメータと node の特徴量を用いて行われるので"動的"と表現されている。

結果

Cityscapes(Semantic Segmentation)で mIoU COCO(Object Detection, Instance Segmentation) を用いて検証。いずれにおいても比較手法よりも高い性能を達成。また既存手法に対して計算量/パラメータ数の効率が良いことを主張しており、全結合グラフを用いる Non-local Net との差が顕著である。

その他(なぜ通ったか?等)

全結合グラフを用いるよりも計算効率が優れているのは勿論、性能面でも良い結果を示しているのが大きい。隣接行列や重みを動的に予測する点も貢献だが、node 集合の sampling を二段階で行っている点の方が工夫として面白い(ただしその分文章が難解になっている)。trainining は 論文のやり方でいいとして inference の際の sampling をどのように行うかが少し気になる。