多次听到该搜索引擎满足10万,20万,30万,100万。。。。2000万搜索,对这个蛮有兴趣的。
目前我自己搞的搜索现在支持10万无压力,更大数据量因为还未有环境去测试,也不知其效果。
可能时间过去很久了,不过代码或在其遇到的问题应该还是可以详细讲讲的吧?
代码可以作为技术学习开源吗?
你用的也是lucene么?
没有实际环境的话,你可以计算一下秒并发,自己写一个脚本,然后本机去压就可以,搜索的查询词就用你们真实的搜索日志就可以。我们当年就是这么测试性能的,效果没问题,跑表能跑多大的压力,最后实际运行就可以的。
时间过去太久了,我们也没有太多经验留存,主要是觉得有价值的就是慢慢熟悉内存模式和优化工具和方法。代码目前也不在我手里面的了。
我们当时用的web server是我写的,已经开源了TinyEasyServer。搜索为了用着方便,以及锻炼队伍,我让我的程序员又写了一套,不过这套还没经过验证,暂时不开。