u++の備忘録

【論文メモ】Sushi Dish - Object detection and classification from real images

論文名

Yeongjin Oh, Seunghyun Son, Gyumin Sim: Sushi Dish - Object detection and classification from real images,  arXiv:1709.00751v2 [cs.CV], 2017.
https://arxiv.org/abs/1709.00751

どんなもの?

回転寿司の会計では、店員が目視で皿の枚数を数えるという負担がある。この負担を軽減するため、画像から皿の柄や枚数を自動的に捉え、支払額を計算する手法を開発した。CNNを用いている。precision 85%、recall 96%、classification accuracy 92%を達成した。

先行研究と比べてどこがすごい?

言及なし

技術や手法のキモはどこ?

  • 検出器
    • エッジ検出(Canny法)
    • 楕円検出
    • 隠れている皿の推定
  • 分類器
    • 多層CNN
      • Input: 検出されたエッジ・楕円
      • 訓練画像にノイズを加えて水増し

どうやって有効だと検証した?

  • 検出器について
    • データセット(only 88 images meet our assumption and there are 461 dishes)
    • 目視と比べて精度を検証
  • 分類器について
    • 訓練データで学習させ、検証データで精度を検証

議論はある?

次に読むべき論文は?

CNNの論文として引用されていたもの。
Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "Imagenet classification with deep convolutional neural networks." Advances in neural information processing systems. 2012.

GithubMatlabコードも公開されている。
https://github.com/YeongjinOh/Sushi-Dish