#271
summarized by : Tong Zheng
Translating a Visual LEGO Manual to a Machine-Executable Plan

どんな論文か?

LEGOの組み立てマニュアルを与えて、マニュアルから読み取った画像を解析し、一個一個のLEGOパーツの位置を推論することで、コンピューターもマニュアル通りに組み立てを実行可能にする。
placeholder

新規性

入力: (1).マニュアルの2D画像 (2).現時点のLEGOモデルの3Dデータ (3).組み立て予定のパーツ (1)(2)と(3)から、(1)の何処に(3)を取り付けるかを推論。さらに、(3)をどれほど回転するか、平行移動するかを推論。すると、出力は: (1)取り付け予定位置 (2)取り付けパーツの回転角度と平行移動距離。

結果

3D pose accuracyとChamfer distanceという指標でSOTA。しかし複雑なLEGOモデルを処理できない。

その他(なぜ通ったか?等)

LEGOの組み立てマニュアルをコンピューター実行可能な命令に翻訳した。