人間のスケッチのクラシフィケーション
※ スケッチ = 熟練者が描いたものではない抽象的な絵(ピクトグラフ)
人間が物体をどのようにスケッチし、そのようなスケッチを人間とコンピューターがどれだけうまく認識出来るかについての正式な研究はこれまでなかった。人間のスケッチに対する最初の大規模な調査。
Amazon Mechanical Turkというクラウドソーシングサービスを利用してデータセットを生成している。
人間の認識精度もAmazon Mechanical Turkを用いて得ている。
学習モデルとしてkNN法、SVMを使用。
データセット
250のカテゴリ:
日常生活で見かける、形状だけで認識可能なオブジェクトを網羅している。
20,000個のスケッチ:
スケッチされたストロークの空間的パラメータと時間的順序を保存する (ただし、この研究では時間的順序は使用されていない) 1カテゴリ毎に80個、合計20,000個のスケッチ。
56%の精度で未知のスケッチを識別できている。
人間と計算機の認識精度の違いを示すマトリックス 赤: 人間の方が良い精度、 青: 計算機の方が良い精度 0は省略している。
人間は73.1%なので人間のほうが圧倒的に精度は高い。
2012年の論文なので人間のほうが認識精度は高いという結果になっているが、現在はどのくらい精度が上がっているのか、他の論文を読んでみたい。