主要实现了BitTorrent DHT协议。爬虫的原理是利用DHT协议监听announce_peer消息,然后根据获得的metada info 下载种子。
你可以用来打造你的海盗湾,也可以进行数据分析。不过要注意版权和被墙的风险,因为里边包含很多限制级资源,比如色情资源。
Github:https://github.com/shiyanhui/dht
原理介绍:http://www.jianshu.com/p/5c8e1ef0e0c3