Learning to Autofocus

#69

summarized by : Teppei Kurita

Charles Herrmann, Richard Strong Bowen, Neal Wadhwa, Rahul Garg, Qiurui He, Jonathan T. Barron, Ramin Zabih

どんな論文か？

機械学習ベースのオートフォーカスの最新手法。カメラのオートフォーカスは、コントラスト式、位相差式があり、それぞれ速度、精度面で課題があるが、そのトレードオフを解決する。本手法では1画像づつ入力してレンズを移動させていくのが基本ユースケースであり、フォーカルスタック内で観測されていない画像以外はゼロにして得られた画像を入力として次々と更新していくことができる。

新規性

スマホを同期させMVSで得られたDepthとフォーカルスタック（焦点距離（ピント）をずらしながら撮影した画像の集合のこと）49枚を対応させた大規模なデータセットを作り学習させたことが一番の新規性。

結果

Middlebury stereo datasetで多数のベースラインアルゴリズムと比較、MSE/RMSEでSOTA。 MobileNetV2でスマホ上で32.5msで動作、単一画像入力、フォーカルスタック入力どちらでも動作する。

その他（なぜ通ったか？等）

治具を作成して素性の良いデータセットを自前で生成しており、地に足がついた検討である印象を受ける。また比較となるベースラインのアルゴリズムの数が圧倒的に多いので結果に説得力がある。更に実用的な速度も出ている。

このページで利用されている画像は論文から引用しています．