【问】tinyfool在podcast多次提到基于lucene搜索引擎,能做一期详讲吗

yangwen13 发布于 2013年08月27日
无人欣赏。

多次听到该搜索引擎满足10万,20万,30万,100万。。。。2000万搜索,对这个蛮有兴趣的。

目前我自己搞的搜索现在支持10万无压力,更大数据量因为还未有环境去测试,也不知其效果。

可能时间过去很久了,不过代码或在其遇到的问题应该还是可以详细讲讲的吧?

代码可以作为技术学习开源吗?

共4条回复
tinyfool 回复于 2013年08月27日

你用的也是lucene么?

没有实际环境的话,你可以计算一下秒并发,自己写一个脚本,然后本机去压就可以,搜索的查询词就用你们真实的搜索日志就可以。我们当年就是这么测试性能的,效果没问题,跑表能跑多大的压力,最后实际运行就可以的。

时间过去太久了,我们也没有太多经验留存,主要是觉得有价值的就是慢慢熟悉内存模式和优化工具和方法。代码目前也不在我手里面的了。

我们当时用的web server是我写的,已经开源了TinyEasyServer。搜索为了用着方便,以及锻炼队伍,我让我的程序员又写了一套,不过这套还没经过验证,暂时不开。

yangwen13 回复于 2013年08月27日

谢谢!

我们也是基于lucene,不过用到了IKAnaylzer中文分词。

现在已经把搜索这部分独立了,只是还有灵活性方面有待提升。

ibuick 回复于 2013年08月27日

我当时在路透的时候就是负责股票搜索,用的就是 lucene,但是时间太久,都忘记了,

tinyfool 回复于 2013年08月27日

@ibuick 那是什么时候啊?你们日搜索量多大?

登录 或者 注册