咱们算一下啊,假设做玩具级别。采用ImageNet的数据,ImageNet 1500万张图片2万多类,覆盖到植物和昆虫的应该不多把,如果采用ImageNet的数据,不自己搞数据,算是玩具级别。训练和识别服务,得一个显卡服务器,方案(1),用云服务器,云上最便宜的,每月3000元;(2)方案2:自己买 gtx1070 的机器,价格在1万-1万5之间,1080的在1万3-2万之间。玩具级别花不了太多钱,缺点就是识别的种类不多,识别率不高。就这,每个月至少也得3000元。
假设是产品级别,那就花钱海了。植物、昆虫子类亚类好多啊,你要把他们区分开,得好多好多样本,这些样本你得自己采集,自己标注,少说也得上百万张样本吧,植物、昆虫的样本又特别难采集,按采集一个样本5块钱算,100万样本就是500万,你自己算算样本采集的费用。然后训练,训练也超花钱啊,mxnet算是对显卡要求低的了,少帅他们训练resnet,花了3万多美元。用 rcnn 之类的模型,上百万的样本,训练要好久好久啊,训练费用至少几十万吧。这还是用大路货技术,要是自己来点创新或者多个技术的组合,又得很多很多钱。