論文名
Yeongjin Oh, Seunghyun Son, Gyumin Sim: Sushi Dish - Object detection and classification from real images, arXiv:1709.00751v2 [cs.CV], 2017.
https://arxiv.org/abs/1709.00751
どんなもの?
回転寿司の会計では、店員が目視で皿の枚数を数えるという負担がある。この負担を軽減するため、画像から皿の柄や枚数を自動的に捉え、支払額を計算する手法を開発した。CNNを用いている。precision 85%、recall 96%、classification accuracy 92%を達成した。
先行研究と比べてどこがすごい?
言及なし
技術や手法のキモはどこ?
- 検出器
- エッジ検出(Canny法)
- 楕円検出
- 隠れている皿の推定
- 分類器
- 多層CNN
- Input: 検出されたエッジ・楕円
- 訓練画像にノイズを加えて水増し
- 多層CNN
どうやって有効だと検証した?
- 検出器について
- データセット(only 88 images meet our assumption and there are 461 dishes)
- 目視と比べて精度を検証
- 分類器について
- 訓練データで学習させ、検証データで精度を検証
次に読むべき論文は?
CNNの論文として引用されていたもの。
Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. "Imagenet classification with deep convolutional neural networks." Advances in neural information processing systems. 2012.
GithubでMatlabコードも公開されている。
https://github.com/YeongjinOh/Sushi-Dish