#49
summarized by : Ryuichi Nakahara
Relationformer: A Unified Framework for Image-to-Graph Generation

どんな論文か?

物体認識と相互関係を1段階で検出する手法
placeholder

新規性

従来の物体・相互関係認識は物体認識と相互関係の検出という二段階手法だったが、本手法では1段階で行っている DETR は物体検出の1段階モデルを応用 関係性を表す [rln] トークンを新たに作り出し、[obj-rln-obj]の組み合わせから類推することで計算量を削減

結果

2Dと3Dのデータセットで良好な結果( Toulouse, 20 US Cities, DeepVesselNet, Visual Genome) 医療画像である血管の三次元構造の抽出も可能

その他(なぜ通ったか?等)

2Dだけでなく3Dでも機能する点が素晴らしい ソースコード公開 https://github.com/suprosanna/relationformer