发你gmail邮箱了,微博私信太不靠谱。
考虑这种结构的思路是这样的:
1 机器学习是非常消耗资源的
2 机器学习所需要的数据,即爬虫获取数据的过程也非常消耗资源
3 如果这些内容都在服务器端实现则会大大提高服务器的压力
对一个穷苦如我的人来说,想尽一切办法来降低服务器端消耗是考虑架构的前提。比如将服务器部署在GAE上,资源小的情况下免费。那么消耗有没有可能通过服务器迁移到客户端呢?应该是可行的。用户要看到的其实是数据呈现,他并不关注计算过程,如果将计算过程打包下放,在客户端完成,那么普通PC机能计算的内容就不用让服务器操心了。
由于一般的web应用,javascript在客户端有很大的限制,无法处理上述复杂的计算。那么暗网作为p2p的解决方案本身由包含了容器,理论上完全可以作为匿名集群的一个节点,用来处理爬取数据,分析数据的环节。