Learning To Solve Hard Minimal Problems

#523

summarized by : yoshiki miyazawa

Petr Hruby; Timothy Duff; Anton Leykin; Tomas Pajdla

どんな論文か？

複数カメラの位置推定では代数方程式を解く必要があり、RANSACが広く用いられてきた。しかしScranton最小化(各視点からの4点を用いて3カメラの相対位置を求める)など多くの誤った解を含む問では、真の解を導出するまでに莫大な処理時間を要してしまう。本論文では、問を入力とし最終的な解に繋がるアンカー(問題と解の多様体)の選択を学習する。また, 初期点にホモトピー連続法を適用し真の解を取得する。

新規性

RANACやホモトピー接続を用いた手法では、確実に解を導出するために多くの開始点からトレース(solve)し、多数の誤った解から真の解を選択(pick)しており、多くの処理時間を要していた。本論文ではシンプルな多層パーセプトロンによって開始点を選択(pick)し、続いてホモトピー連続法で真の解を取得(solve)する。従来のsolve＆pickに対し、pick＆solveの枠組みを提案している。

結果

ETH 3Dデータセットで評価し、一回のScranton最小化に対し従来法は0.64s, 提案法は65μsで、約10,000倍の高速化を達成した。また簡単な最小化である5点問題においても、10.8μsと高速であることを示している。

その他（なぜ通ったか？等）

画像処理の当たり前であった手法(solve＆pick)を覆す手法(pick＆solve)をシンプルなNNで実現できたこと。様々なアプリ(三次元復元や自己位置推定など)や開発者・研究者(大規模な計算資源やデータの有無に関わらず)に大きな貢献を期待できることが理由と考える。 Github：https://github.com/petrhruby97/learning_minimal

このページで利用されている画像は論文から引用しています．