【論文メモ】Sushi Dish - Object detection and classification from real images

論文名

Yeongjin Oh, Seunghyun Son, Gyumin Sim: Sushi Dish - Object detection and classification from real images, arXiv:1709.00751v2 [cs.CV], 2017.
https://arxiv.org/abs/1709.00751

どんなもの？

回転寿司の会計では、店員が目視で皿の枚数を数えるという負担がある。この負担を軽減するため、画像から皿の柄や枚数を自動的に捉え、支払額を計算する手法を開発した。CNNを用いている。precision 85%、recall 96%、classification accuracy 92%を達成した。

先行研究と比べてどこがすごい？

言及なし

技術や手法のキモはどこ？

検出器
- エッジ検出（Canny法）
- 楕円検出
- 隠れている皿の推定
分類器
- 多層CNN
  - Input: 検出されたエッジ・楕円
  - 訓練画像にノイズを加えて水増し

どうやって有効だと検証した？

検出器について
- データセット（only 88 images meet our assumption and there are 461 dishes）
- 目視と比べて精度を検証
分類器について
- 訓練データで学習させ、検証データで精度を検証

議論はある？

データセット数が小さい
何かしらの機械学習アルゴリズムを適用することで精度が向上しそう

次に読むべき論文は？

CNNの論文として引用されていたもの。
Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "Imagenet classification with deep convolutional neural networks." Advances in neural information processing systems. 2012.

GithubでMatlabコードも公開されている。
https://github.com/YeongjinOh/Sushi-Dish